COSMIC 데이터베이스 사용법

COSMIC 데이터베이스 사용법
COSMIC 데이터베이스는 Catalogue of Somatic Mutation In Cancer의 줄임말이며 해당 주소(https://cancer.sanger.ac.uk/cosmic)로 접근할 수 있다. COSMIC을 제공하는 기관은 Sanger institute이며 세계 최대 규모의 somatic variant database이다. COSMIC은 여러 저널에서의 데이터와 ICGC, TCGA, PCGP와 같은 암 데이터 포탈에서 얻을 수 있는 데이터들을 취합하였다. 때문에 암 변이에 관련된 정말 많은 정보를 COSMIC에서 얻을 수 있지만 데이터가 방대한 만큼 어디에 무엇이 있는지, 내가 활용할 수 있는 데이터가 있는지 찾아보는 것도 쉽지 않다. 때문에 COSMIC에서는 어떤 데이터가 있으며 어떻게 활용할 수 있는지 정리해보았다.

Gene curation


COSMIC 데이터베이스에 존재하는 유전자들의 샘플, 변이, 문헌에 대한 집계 데이터를 확인 할 수 있다. 또한 관심 있는 유전자를 클릭하면 해당 유전자에 변이가 나타난 개인의 특징, 조직의 특징, 샘플의 특징, 변이들의 특징들을 알려준다. 물론 이러한 특징 데이터는 상당 부분 빠져있기 때문에 해당 데이터를 활용하여 유의미한 분석을 하기란 쉽지는 않다…

개인의 특징
– 환자의 나이, 인종, 성별 등

조직 특징
– tumour source(e.g. primary인지 metastasis인지)
– metastatic site
– stage
– grade
– drug response
– cytogenetic

샘플 특징
– 샘플 소스(surgery-fixed, autopsy-ns, cell line)
– mutation allele specification (동일 샘플 동일 유전자에서 1개 이상의 변이가 있는 경우)
– MSS/MSI

변이 특징
– LOH
– mutation detail
– zygosity, somatic status
– normal tissue도 테스트 되었는지 여부

Gene fusion curation


염색체 재배열로 인해 발생하는 유전자 융합 또는 전좌는 가장 흔한 돌연변이 유형이다. 이는 새로운 프로모터 또는 인핸서 영역의 병치를 통해 키메라 전사체 또는 유전자의 조절 완화를 유도한다. fusion 변이들의 샘플, 변이, 문헌에 대한 집계 데이터를 확인 할 수 있다.

Genome screen

WGS,WES 데이터를 curation한 저널, pubmed id, tumor type 정보와 ICGC,TCGA,PCGP 스터디 ID등을 제공한다.

Drug Resistance


COSMIC은 획득 저항(치료 후) 및 내재 저항(치료 전)을 부여하는 돌연변이를 포함하여 문헌에서 저항 돌연변이로 확인된 돌연변이에 대한 데이터를 제공한다.

Mutational signatures


체세포 돌연변이는 인체의 모든 세포에 존재하며 평생 동안 발생한다. 이는 DNA 복제 기계의 본질적인 약간의 불충실함, 외인성 또는 내인성 돌연변이 유발 물질 노출, DNA의 효소적 변형 및 결함 있는 DNA 복구를 포함하는 다양한 돌연변이 과정의 결과이다. 다양한 돌연변이 과정은 “Mutational signatures”이라고 불리는 독특한 돌연변이 유형 조합을 생성한다. 변이의 패턴을 보고 담배로 인한 변이인지, chemotherapy로 인한 변이인지 등을 파악할 수 있는 것이다.
해당 데이터를 Mutational signatures에서 제공한다.

Actionability

암의 돌연변이를 표적으로 삼는 약물의 반응성을 보여주고 신약의 반응성에 대한 임상 연구의 진행 상황을 추적해서 제공해준다.


Leave a Comment

목차