Presentation is loading. Please wait.

Presentation is loading. Please wait.

인공지능시스템 (Artificial Intelligent)

Similar presentations


Presentation on theme: "인공지능시스템 (Artificial Intelligent)"— Presentation transcript:

1 인공지능시스템 (Artificial Intelligent)
제 11 장 바이오 인포메틱스 (Bioinformatics) Slide 1 (of 16)

2 We need a something different tool !
바이오 인포메틱스 관점 We need a something different tool ! Slide 2 (of 16)

3 바이오 인포메틱스 정의 생물정보학 Computational biology, computational molecular biology 컴퓨터를 이용해서 생물정보의 해석을 목적으로 하는 학문분야 정보학적 관점과 방법론을 통해 생물학을 이해하고 연구하는 과학의 학 분야이며 컴퓨터 생물학의 한 분야로서 생물 시스템을 모델링하기 위해 사용하는 정량 분석 기법의 응용분야 중 하나 컴퓨터를 이용하여 생물학을 연구하는 모든 분야(광의 의미) DNA나 단백질(protein)의 서열정보를 해석하고자 하는 분야(협의 의 미) 컴퓨터를 도구로써 이용하여 생물시스템의 성격을 수학이나 물리학적 모델로 바꾸고 그 데이터를 분석하기 위해 새로운 알고리즘으로 데이 터베이스를 개발하여 그 데이터베이스를 이용할 수 있는 접근도구까 지 만드는 총체적인 기술 Slide 3 (of 16)

4 바이오 인포메틱스 태동 1920년 H.Winker가 염색체 1조를 나타내기 위해 genome (염색체 또는 유전 자 전체를 의미) 용어 사용 Genome: gene (유전자)+ some(형체) = 유전체(게놈 또는 지놈) 인간 유전체 프로젝트(genome project) 1990년대, 한 생물체가 지닌 모든 유전정보를 완전히 밝혀 그 특성을 분석하여 규명하고자 하는 전세계적인 연구사업 인간의 염기서열을 밝히는데 있어서 가장 중요한 수단이 바이오 인포메틱스 이다. 바이오 인포메틱스는 컴퓨터를 이용해 유전체를 분석해서 상관관계나 연관성 파악하여 각 유전자들의 진화과정 및 연관정보를 예측하는 것 바이오 인포메틱스 태동 Frederic Sanger에 의해 단백질 서열결정 방법이 개발된 이후, 1960년대 부터 시작되었다고 함 유전학(genomics): 구조유전학과 기능유전학으로 구분되어 연구 프로테오믹스(proteomics): 단백질 데이타베이스 구축과 단백질 기능예측으로 구분 Slide 4 (of 16)

5 생물학과 다른분야와의 관계 정보기술 하드웨어 및 기계활용 수학 및 물리학적 모델활용 컴퓨터처리 실험 DNA 서열
하드웨어 및 기계활용 수학 및 물리학적 모델활용 컴퓨터처리 실험 DNA 서열 유전자, 유전체 생물체 분자 친화학 단백질 구조, 폴딩, 기능과 상호작용 대사경로 신호전달 네트워크 조절 생리학과 세포생물학 종간 상호작용 생태학과 환경시스템 방법론과 전문기술 유전체 서열결정 유전체 데이타분석 통계 유전학 단백질체학 기능 유전체학 (마이크로어레이 2D-PAGE등) 하이테크 생태학 전산 생태학 단백질 구조예측, 단백질 역학, 단백질 폴딩과 설계 복잡한 생물학적 데이터에 대한 데이터 규격화, 데이터 표현, 분석도구 동적 시스템 모델링 서열 -> 생화학 그리고 그 이상 생화학 그리고 그이상 서열 Slide 5 (of 16)

6 생물학과 컴퓨터 바이오 인포메틱스는 단순히 생물학과 컴퓨터의 만남 이상의 의미를 갖는 다.
컴퓨터는 생물학적 데이터를 DB화 하고, 이 DB로 부터 사용자가 원하는 정보를 얻기위한 인터페이스 설계, 웹 서비스 등을 하기위한 기반기술로써 이용된다. 생물학에서 컴퓨터 할용의 예 새로 발견한 유전자 기능에 대한 가설설정을 위해 서열비교를 하거나 단백질 폴딩(folding) 예측을 위해 단백질 3차원 구조에 대한 정보를 비트단위로 나누어 패턴검색을 할 때 사용 단백질과 대사물질이 세포안에서 어떤 작용을 하는지 예측할 때 사용 세포의 기능에 대한 모델링시 사용 생물체의 기능과 형태를 유전체 서열에 기반해 모델링 할 수 있도록 하는 역할 제공 인간 유전체 프로젝트에서 이미지 프로세싱 기법을 이용한 유전체 지도 작성 X선 결정학기술을 이용한 단백질 분석 DNA 마이크로어레이 분자생물학 기술에 컴퓨터 활용 생물학과 관련된 모든 데이터를 분류/ 목록화하여 공공 DB화 하고, 연구할 수 있는 지도(map) 작성 Slide 6 (of 16)

7 생물학에서 컴퓨터 역할 공공 데이타베이스와 데이터 양식의 사용 서열 정렬과 서열검색 유전자 예측 다중 서열 정렬
계통 발생 분석 서열 데이터에서의 패턴과 프로필 추출 단백질 서열 분석 단백질 구조 예측 단백질 구조 특성 분석 단백질 구조 정렬 및 비교 생화학 시뮬레이션 전체 유전체 분석 프라이머 디자인 DNA 마이크로어레이 분석 단백질체 분석 Slide 7 (of 16)

8 바이오 인포메틱스의 컴퓨터활용방법 * 세부 알고리즘은 교재 참조할 것: FASTA, BLAST 등 컴퓨터 활용분야 방법
컴퓨터 도구(알고리즘) 서열분석 알고리즘의 개발 유사성 비교의 원리를 사용 (측정 행렬, gap 이용) Smith-Waterman, FASTA, BLAST 염기서열의 패턴을 이용 PROSITE, LOCK, PRINT, Multiple alignment genomic project를 이용한 2차 유용 DB PEDENT, Entrez genome division, UniGene, COG 밝혀진 서열정보들의 효과적인 데이터베이스 및 생명공학을 위한 종합 정보 시스템 구축 Bioinformation catalog * 세부 알고리즘은 교재 참조할 것: FASTA, BLAST 등 Slide 8 (of 16)

9 생물학적 데이터와 정보소스 현재 500 여 개의 생물학 데이터베이스가 존재<표 11.2>
특정 주제에 대한 총괄적인 정보를 얻기는 불가능 통합 검색 필요 Data warehousing Indexing Middle ware system 주요 생물학 데이터와 정보소스<표 11.3> 참조할 것 Slide 9 (of 16)

10 NCBI의 GenBank 미국립 생명공학 정보센타(National Center of Biotechnology Information, NCBI): 미 국립보건원(National Institute of Health, NIH) 산하 기관 웹 브라우저로 메드라인(Medline) 데이타베이스 검색을 가능하게 하는 무료 서버 제공 NCBI의 GenBank(GenBank/EMBL/DDBJ) 가장 완벽한 DNA 염기서열 정보를 유지하는 유전정보 데이타베이스 유럽 EMBL(분자생물학 연합회)과 일본 DDBL(DNA Databank of Japan)와 자료교환 및 공유 주 사이트: ftp://ncbi.nlm.nih.gov 무료다운로드 가능 펍메드, 분류학 데이타베이스, 단백질 서열과 구조 데이터 접근방법 제공 각 개체, 출처, DNA 종류, mRNA로 부터 cRNA, EST에 이르는 염기서열, 유전체 염기서열 정보, 서열 다형성(sequence polymorphism) 정보 등 제공 각 연구자에 맞는 적합한 데이터 집합의 검색 가능한 점이 특징 Slide 10 (of 16)

11 다른 데이타베이스 SWISS-PROT PDB (Protein Data Bank) 단백질 서열만을 모으는 데이터베이스의 대표
University of Geneva의 Dr. Amos Bairoch에 의해 만들어져 오다가, 최근에는 EBI (European Bioinformatics Institute)와 공동으로 작업 PDB (Protein Data Bank) 단백질, DNA, RNA의 3차원구조를 모아놓은 데이터베이스 미국의 Brookhaven National Laboratory에서 만듦 염기열 데이터에서의 GenBank의 역할과 같은 역할을 생체분자의 구조 데이터에 대해서 수행  Slide 11 (of 16)

12 바이오 인포메틱스 활성화 방안 바이오 인포메틱스 기술개 발 검색 및 분석도구 개발 다중정렬 및 계통 발생학적 분석도구 개발
다중정렬 및 계통 발생학적 분석도구 개발 패턴 분석도구 개발 영상표현기술 개발 컴퓨터 구조생물학 연구 개인 유전체 프로젝트 연구 기타 컴퓨터를 활용한 연구 개발 Slide 12 (of 16)

13 바이오 인포메틱스 미래 <현 연구 단계> <당면과제> 현재는 연구 초기단계 필요성에 의한 참여기업 급증
데이터 축적 및 응용 모색 제약산업의 응용가능성 Chip을 통한 질병진단, 예측 개인별 유전적차이 감별 및 맞춤의약 집단유전학 및 전염병 예측, 예방 농업관련 응용가능성 작물 품질 개량 및 증산 의약용 작물 출현 환경관련 응용가능성 개량효소와 미생물을 통한 생물공정 에너지, 환경 문제에 응용 DNA computer 의 가능성 <당면과제> 필요성에 의한 참여기업 급증 제약기업, Biotech, IT 전략적제휴와 Network genomics, proteomics, microarray 생물산업의 구조와 방향이 변화 생물정보학을 중심으로 외부환경의 변화 사회적인식, 정부규제 생물정보학 인프라 발달 정보관리시스템, 분석 tool, Network 고속 대용량 시스템 요구 IBM (Blue Gene, 1억 $) DB 표준화 및 통합 XML(extensible markup language) Slide 13 (of 16)

14 바이오 인포메틱스의 연구방향 구조적 유전학 기능적 유전학 정상인의 표현패턴 제어 영역에서의 질병의 표현패턴 DNA 서열
과거 역 유전학 현재 전체 유전체 서열 시대 미래 후 유전체 시대 분자생물학 유전체 기술 유전학 구조적 기능적 유전학 바이오 인포메틱스 구조적 유전학 인포메틱스 tRNA의 DNA서열 제어 영역에서의 DNA 서열 정상인의 표현패턴 단백질 생상물의 유전자구조 질병의 표현패턴 서열 변이 질병과 관련된 동물 모델에서 유전자 변형 Slide 14 (of 16)

15 바이오 인포메틱스 연구확장 생물정보학 인프라 관리시스템, 분석 tool, Network 생명현상 탐구 데이터 정보 지식 제품
Microarray (Bio chip) Structural Genomics Functional Proteomics Pharma- cogenomics Slide 15 (of 16)

16 바이오 인포메틱스 응용분야 농업(식물) 제약산업(동물) 환경산업(미생물) 작물보호기술 (잡초, 병충, 병원균)
작물 생산성 및 품질 향상, 환경보전 애기장대, 쌀, 밀, 옥수수, 대두 등 Pioneer Hi-Bred(Du Pont), Monsanto, 등 미농무성 (390만$/년) 식물게놈DB(PhytoSeq, Incyte) Fruit fly 게놈(곤충 및 병충, Celera genomics) Cereon Genomics(Monsanto, Millenium P) Novatis (Functional genomics R&D) 제약산업(동물) 유전정보의 공개로 data 개발능력이 좌우 생물정보운용능력이 관건 (속도) Data mining, Knowledge discovery… Millenium Pharmaceuticals 와 Bayer 5년, 4억 6,500만 $, 골다공증, 암등 7개 질병 Lion Bioscience 와 Bayer 5년, 1억 $, 신약유전자 target Incyte Pharmaceuticals Abbott Lab., Novatis, BASF, Glaxo Wellcome, SmithKline Beecham, Bayer, Pfizer... 환경산업(미생물) Bioremediation, 산업용 효소 및 생물소재 대사 향상 효소 및 미생물 design 새로운 공정 및 제품개발 E. coli를 비롯 130여종 완료 또는 진행 중 <향후 시장규모> 시장구조 200 여개 이상의 관련회사 Genome project 연구 결과 공개 값어치 있는 연구 결과는 비공개 추세 Slide 16 (of 16)


Download ppt "인공지능시스템 (Artificial Intelligent)"

Similar presentations


Ads by Google