Learning Classifier using DNA Bagging 컴퓨터 공학부 2004-31034 석호식 생물정보학 협동과정 2004-30165 정제균 2004-20643 소영제 고급 인공지능
DNA Bagging - Introduction DNA computing + Bagging 복수 개의 weak learner의 조합에 의한 분류 ≤ ? Cray X1 super computer LG-IBM 행망용 PC 고급 인공지능
Motivation of DNA Bagging(1/3) Cluster 분류 기준은 무엇인가? 가정1 유효한 속성은 모두 관찰됨 고유 패턴의 존재 클러스터 분류기준 각 클러스터에 고유한 패턴이 존재할 것이라는 가정 고급 인공지능
Motivation of DNA Bagging (2/3) 고급 인공지능
Motivation of DNA Bagging (3/3) Test tube holds trillion computers 테스트 튜브에 많은 DNA 시퀀스를 넣는 것은 가능 DNA 시퀀스 하나의 표현 능력은 무한한가? Limit of 10k 고급 인공지능
Bagging Weak learner + majority voting 고급 인공지능
DNA Bagging Weak learner의 생성 및 majority voting 일반적인 Bagging과 차이 loop의 존재 Weak learner의 생성을 위한 루프이므로 표준 Bagging과 큰 차이라고 볼 수 없음 복잡도를 증가시키며 가설을 생성하는 과정 복잡도: 가설 생성에 사용된 속성의 수 고급 인공지능
Weak learner의 표현 DNA 일차 구조를 이용한 weak learner 표현 복잡도(생성에 참여한 속성의 수)를 늘려가면서 candidate weak learner 생성 고급 인공지능
Weak learner에 의한 분류 (1/3) 생성된 weak learner중 유효한 weak learner가 무엇인지 결정된 상태에서 unknown instance를 분류하는 과정 고급 인공지능
Weak learner에 의한 분류 (2/3) Sequence Temp 모든 속성이 모인 경우 Sequence temp 와 같은 연속된 하나의 시퀀스 생성 고급 인공지능
Weak learner에 의한 분류 (3/3) 분리된 시퀀스가 포함된 용액을 검출 기능의 튜브 혹은 DNA chip으로 이동 검출 기능의 probe에 결합되는 시퀀스가 있는 경우 해당 weak learner 만족 고급 인공지능
Key idea of DNA Bagging 핵심 아이디어 Weak learner = 속성의 조합 유전자 발현 데이터 바탕의 Decision tree 생성 각 클러스터에 고유한 경로생성 경로를 구성하는 속성의 패턴 존재 Weak learner = 속성의 조합 복수 개의 weak learner를 만족하는 unknown instance의 경우 소속 클러스터를 결정하는 기준은? Positive training set과 negative training set으로부터 만들어진 weak learner의 결합 비율 고급 인공지능
Simulation result 복잡도 2 (속성 2개로 구성)의 weak learner를 사용하여도 90%이상의 정확도 획득 Training set Test set 복잡도 2 (속성 2개로 구성)의 weak learner를 사용하여도 90%이상의 정확도 획득 ID3의 유사한 성능 고급 인공지능
Conclusion and Discussion 결론 DNA 컴퓨팅과 ML 기법을 이용한 분류 방법론 제시 Weak learner간의 Majority voting을 이용한 분류 방법론 제시 추가연구 실제 질환 데이터를 사용할 경우 표현 방법 연구 필요 In vivo 환경에서 실험할 수 있는 표현 방법 연구 필요 형광 물질외의 인식자(Identifier) 이용 필요 고급 인공지능