Python(파이썬): NamedTuple

파이썬에는 튜플인데 딕셔너리 성격을 가진 튜플인 NamedTuple이 있다. 튜플의 성격처럼 불변형이라서 중요한 데이터를 담는 데 유용하다. 뿐만 아니라 일반 튜플과 달리 직관적으로 무슨 데이터인지 알 수 있게 데이터 모델링이 가능하다. ‘NamedTuple’ 알고 있으면 정말 유용하게 사용할 수 있을 것 같아서 정리해보았다. NamedTuple 사용 방법 collections의 namedtuple를 import 합니다. 직원의 이름, 부서, 연봉 데이터를 담는 데이터를 … Read more

Python(파이썬): 시퀀스 자료형 분류 및 예제

Python(파이썬): 시퀀스 자료형 분류 및 예제파이썬에 어떤 시퀀스 자료형들이 있고 이들의 특성들은 무엇인지 잘 알아야 원하는 순간 적절한 자료형을 사용할 수 있는 것 같다. 해당 포스트는 이전에 공부했던 파이썬 시퀀스 자료형의 분류와 예제를 정리하였다. 시퀀스 자료형이란 데이터가 순서대로 나열된 형식을 의미한다. (이때, 데이터가 순서대로 나열되었다는 뜻일 뿐 정렬되어있다는 의미는 아니다.) 리스트, 튜플 같은 것들이 대표적으로 … Read more

초보자 파이썬 시작

파이썬 시작: 저도 아직 파이썬 고수는 아니지만… 제가 처음 파이썬을 시작하였을 때 고민하였던 것, 혹은 알았다면 좋았을 것이라고 생각되는 것을 5개를 적어보았습니다. 백문이불여일타 ‘파이썬 시작’ 을 위해서는 눈으로만 보지 말고 무조건 코드를 입력하고 실행까지 해보기를 추천 드립니다. 눈으로만 보는 것과 실제 입력하는 것과는 천지차이 입니다. 하고 싶은 것 결정 우선 파이썬으로 데이터 분석을 하고 싶은지, … Read more

COSMIC 데이터 분석 시 알아야 할 것

COSMIC 데이터 분석 시 알아야 할 것 COSMIC 데이터는 대용량 데이터로 매력적으로 보이지만 데이터가 큰 만큼 지저분하고 데이터를 해석하기 위해 알아할 내용도 많다 . 뿐만 아니라 웹페이지에서 자세히 설명하지 않은 부분도 존재하기 때문에 얼핏 봐서는 데이터를 오해하기 십상이다. 때문에 COSMIC 데이터 분석 시 알아야 할 것을 몇 가지 정리하였다. COSMIC data에서의 mutation 빈도는 실제 mutation … Read more

COSMIC 데이터베이스 사용법

COSMIC 데이터베이스 사용법COSMIC 데이터베이스는 Catalogue of Somatic Mutation In Cancer의 줄임말이며 해당 주소(https://cancer.sanger.ac.uk/cosmic)로 접근할 수 있다. COSMIC을 제공하는 기관은 Sanger institute이며 세계 최대 규모의 somatic variant database이다. COSMIC은 여러 저널에서의 데이터와 ICGC, TCGA, PCGP와 같은 암 데이터 포탈에서 얻을 수 있는 데이터들을 취합하였다. 때문에 암 변이에 관련된 정말 많은 정보를 COSMIC에서 얻을 수 있지만 데이터가 … Read more

COSMIC에서 사용하는 식별자 COSV와 COSM

COSMIC에서 사용하는 식별자 COSV와 COSM: COSMIC은 Catalogue of Somatic Mutation In Cancer의 약자이며 해당 주소(https://cancer.sanger.ac.uk/cosmic)로 접근 할 수 있다.COSMIC에서는 변이를 식별하기 위해서 COSV와 COSM 두 가지를 사용한다. 간단히 말하면, COSV는 현재 사용되고 있는 변이의 식별자이며 genomic position이 있다면 무조건 COSV가 있다. 반면 COSM은 과거에 사용했던 변이의 식별자이며 genomic position 정보가 없어도 된다. 자세한 차이는 아래에 … Read more