PRESENTATION EMBEDDED AND BIO DATABASE LAB YONSEI UNIVERSITY, XX JUNGRIM KIM
INDEX I.Introduction II.Biclustering III. 검증 방법 IV.Q&A 2/17
INTRODUCTION BIOINFORMATICS 방대한 양의 사용 가능한 생물학적 데이터의 등장하였고, 이를 이용하여 새로운 지식을... 3/17
INTRODUCTION ISSUE 1 (DRUG REPOSITIONING) 4/17
INTRODUCTION ISSUE 2 (CONSTRUCTING DISEASE NETWORK) 질병 네트워크는 질병의 연구에 있어서 중요한 역할을 할 수 있음 질병간의 관계를 이해하는데 새로운 시야를 제시 가능 5/17
INTRODUCTION ISSUE 3 (IDENTIFYING FUNCTIONALLY RELATED GENE MODULE) Conditions Genes mRNA expression +1 Functional gene module g1g1 g1g1 g2g2 g2g2 g3g3 g3g3 g4g4 g4g4 g5g5 g5g5 Biclustering method 유사 한 발현 패턴 Biclustering method 는 mRNA 데이터의 특정 condition 에서 유사 한 발현 패턴을 가지는 유전자 집 합을 찾는데 사용됨 특정한 기능에 관여 찾아낸 유전자 집합은 생물체 내에 서 특정한 기능에 관여하는 유전자 집합이라고 간주할 수 있음 6/17
INTRODUCTION ISSUE 4 (BIOMEDICAL TEXT MINING) Text mining 기술을 사용하여, 비구조화된 생물학적 데이터로 부터 숨겨진 유의미한 결과를 도출할 수 있음 대표적인 예로, ABC model 방법 등을 활용하여 생물학적 entity 간의 관계 데이터를 추출하는 연구가 있음 Detection of AR-V7 in circulating tumor cells from patients with cresistant prostate cancer may be associated with tamide and abiraterone. These findings require large- scale prospective validation. (Funded by the Prostate Cancer Foundation and others.). 7/17
INTRODUCTION ETC 8/17
BICLUSTERING BACKGROUND Clustering 기법이란, 전체 condition 에서 유사한 mRNA 발현 패턴을 갖는 유전자 집합을 찾는데 사용됨 9/17
대부분의 질병이 다양한 subtype 을 갖고 있기 때문에, subtype 에 관여하는 유전자 집합을 찾기 위해서는 clustering 기법으로 는 한계가 존재함 Biclustering 기법이란, 유전자와 condition 을 동시에 clustering 하여 특정 condition 에서 유사한 발현 패턴을 갖는 유전자집합을 찾기 위하여 사용되는 기술임 BICLUSTERING BACKGROUND 10/17
biclustering 기법에서 이슈는 크게 아래와 같음 1) NP-hard 문제 2) 발현 패턴 BICLUSTERING ISSUE 11/17
12/17 BICLUSTERING ISSUE Greedy Algorithm
13/17 BICLUSTERING ISSUE Genetic Algorithm
14/17 BICLUSTERING ISSUE
검증방법 GO TERM ENRICHMENT GO term (Gene Ontology term) 유전자와 유전자 생성물의 기능을 정리해놓은 데이터 GO term 은 3 가지로 분류 됨 I.Cellular component II.Molecular function III.Biological process GO term 데이터를 이용하여 유전자 모듈이 통계적으로 유의미 하게 공유하고 있는 GO term 을 확인함으로써 찾아낸 유전자 모듈을 검증 15/17
검증방법 GO TERM ENRICHMENT 16/17
검증방법 PATHWAY ENRICHMENT Pathway 생물체 내부에서 일어나는 현상의 경로를 저장해 놓은 데이 터 Pathway 데이터를 이용하여 유전자 모듈이 통계적으로 유의 미하게 포함되어 있는 pathway 를 확인함으로써 찾아낸 유전자 모듈을 검증 17/17
Q&A