인공지능시스템 (Artificial Intelligent)

Slides:



Advertisements
Similar presentations
거의 모든 것의 역사 ( 빌 브라이슨 지음, 이덕환 옮김, 까치, 2003) 이 덕 환 서강대학교 화학과, 과학커뮤니케이션.
Advertisements

Chapter 4 인간게놈 프로젝트 (Human Genome Project). 1. 게놈 (genome) 이란 - DNA : 유전정보를 담고 있는 물질로 A, T, G, C 라는 염기로 구성 - 유전자 (gene) : DNA 가운데 특정 단백질로 발현되는 DNA - 염색체.
웹 기반 Alignment Program 졸업 프로젝트 - 중간발표 - 민혜라 신은정 장시경 황소영 컴퓨터 응용 공학 및 실습.
2012 Knowledge Service Engineering Knowledge Service Engineering.
의료자원 규제현황과 개선방향 자원평가실. 의료자원 관리 개요 규제개혁 토론과제.
휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science
(화) 나로고등학교 미래 과학 기술 전망과 이공계 진로 선택 순천대학교 사범대학 환경교육과 교수 강형일.
품종보호제도 강화를 위한 유전자 분석 기술의 활용
7장 텍스트의 처리 7.1. 자연어 처리의 개요 자연어 처리의 중요성 자연어 처리의 기반 기술
바이오산업 Back on the Radar Screen
연 합 남 전 도 회 월 례 회 1부 예배- 찬 송 장 다같이 2011년 1월 2일 1부 예배- 찬 송 장 다같이 기 도
사 업 계 획 2011년 제1호 - 2월 1일 2011 주 안에서 소통하며 화합하고 참여하며 헌신하는 남신도회
실습 – MODi Eunok Paek Dept. of Computer Science & Engineering
Gene Cloning.
The Genomics Institute (TGI)
GENETIC TECHNOLOGY 생물학개론 15주차 강의
Protein Sequencing KOREA UNIV. Chem. & Bio Eng 박 기 태.
2. 분자생물학 데이터베이스 2.1 역사적인 배경 분자유전체학과 이영애.
게놈 (지놈)이란? 게놈(genome)은 유전자(gene)와 염색체(chromosome)
Molecular Biological Tools in the Environmental Engineering
VectorNTI 사용법 교육 Insilicogen, Inc. Consulting Team 이 기 용.
소프트 컴퓨팅 연구실.
1 PROJECT TITLE 기획 PAGE NO. 웹 페이지 구성 화 면 번호 화 면 설 명 연 결 화 면 L1 L4 L7
분자생물학실험 SUBJECT Electrophoresis 결과 확인, Sequence blast
Importing GEO data into MIAME format-based information System
성균관대학교 융합생명공학과 Integrative Biotechnology
생명의 청사진 분자유전체의학 김윤경.
세포생물학 Chapter 7: 핵과 DNA 복제.
.
2018-2학기 캡스톤디자인 실습지원비 사용설명회
비특허문허 검색 Know-How 생명공학 분야 - 신 원 혜 생명공학심사과.
Bioinformatics 자연과학대학 화학과.
정보기술을 이용한 단백질 서열 분석 (IT-based Protein Sequence Analysis)
제15장. 유전체 조작과 연구 유전체 사업 유전공학 분자도구들 생명 윤리.
바이오칩의 현황과 미래 생명공학지원과 신희정.
윤리연구관련 ELSI 제도 - 운영경험을 중심으로
Ⅲ-3. 생명의 연속성 5. 유전적 다양성과 현대의 진화
DNA에서 단백질합성까지 잼 있게 공부해! 생물교육과 이 성 현.
계약의 성립 청약 승낙 계약의 성립요건인 의사의 합치여부에 대한 판단 계약의 효력발생 시기
제 6장. 유전체 지도 작성과 지도 데이터베이스.
바이오 보건산업 활성화를 위한 조직은행 추진방안
서울대 의과대학 흉부외과학교실 서울의대 보라매병원 흉부외과
아이스랜드 경우:deCODE社의 전략 Iceland 아이슬란드 정부 & deCODE Genetics사
Bioinformatics and Biomedical Imagining 연구회
IV. 단백질 합성 4.10 폴리펩티드, 아미노산 및 펩티드 결합 4.11 번역 및 유전암호 4.12 운반 RNA
01. 데이터베이스와 SQL 개요.
국립환경과학원 「 환경보건센터(NCEH)」설치/ 운영계획
지능형 생물정보처리 시스템 제1회 수퍼지능칩 및 응용기술 워크샵 장 병 탁 서울대학교 컴퓨터공학부
돌연변이 생물교재론 양현주.
분자생물학 데이터베이스의 새로운 세대 정희준
제 8장 서열정렬과 데이터베이스 검색.
Challenging Issues 다양한 형태로 흩어져 있는 데이터를 어떻게 모으고 관리할 것 인가?
제안 목적 고객성향 분석으로 매출 증대 유사업체 분석으로 신상품 홍보 원가요소 분석 및 피드백으로 원가율 관리
청각기관의 구조와 기능2 옥정달.
국제물류.
Data Mining and Bioinformatics Lab
Bio의 시대 조동성 국립 인천대학교 총장.
분자생물학 데이터베이스 - 역사적인 배경 년 3월 28일 정용진.
2019-1학기 캡스톤디자인 실습지원비 사용설명회
5. 구조 데이터베이스 구조모델: 아름답고 신기.
천연물 농·산업 빅데이터 기반 바이오 클라우드 구축: 1차 기획안 한국과학기술연구원 강릉분원 천연물 연구소
원시 지구에서 단백질과 핵산은 어떻게 만들어졌는가?
교재: GENETICS (Snustad & Simmons, 5/6 ed.) 수업 시간: 화, 목, 3 - 4:15 pm
4.2 생화학 네트워크의 원리 정 희 준.
중등교육과 2015 개정 교육과정 주요 내용 이 프레젠테이션은 PowerPoint의 새로운 기능에 대해 안내하며, 슬라이드 쇼에서 가장 잘 보입니다. 이 슬라이드에서는 PowerPoint 2010에서 만드는 프레젠테이션에 대한 설명을 제공합니다. 더 많은 예제 서식 파일을.
Computer Network Lab. Keimyung University
2007년 한•일 공동 식물바이러스 심포지엄 및 정기 학술 발표회
Project Presentation Title
환경 바이오 센서 등록 정보 및 약도 산업자원부 산업기술기반조성사업 생물산업 기술인력 단기양성 프로그램
DNA로 기록된 생물정보와 정보의 활용 중심원리, 생명공학, 농업혁명.
Presentation transcript:

인공지능시스템 (Artificial Intelligent) 제 11 장 바이오 인포메틱스 (Bioinformatics) Slide 1 (of 16)

We need a something different tool ! 바이오 인포메틱스 관점 We need a something different tool ! Slide 2 (of 16)

바이오 인포메틱스 정의 생물정보학 Computational biology, computational molecular biology 컴퓨터를 이용해서 생물정보의 해석을 목적으로 하는 학문분야 정보학적 관점과 방법론을 통해 생물학을 이해하고 연구하는 과학의 학 분야이며 컴퓨터 생물학의 한 분야로서 생물 시스템을 모델링하기 위해 사용하는 정량 분석 기법의 응용분야 중 하나 컴퓨터를 이용하여 생물학을 연구하는 모든 분야(광의 의미) DNA나 단백질(protein)의 서열정보를 해석하고자 하는 분야(협의 의 미) 컴퓨터를 도구로써 이용하여 생물시스템의 성격을 수학이나 물리학적 모델로 바꾸고 그 데이터를 분석하기 위해 새로운 알고리즘으로 데이 터베이스를 개발하여 그 데이터베이스를 이용할 수 있는 접근도구까 지 만드는 총체적인 기술 Slide 3 (of 16)

바이오 인포메틱스 태동 1920년 H.Winker가 염색체 1조를 나타내기 위해 genome (염색체 또는 유전 자 전체를 의미) 용어 사용 Genome: gene (유전자)+ some(형체) = 유전체(게놈 또는 지놈) 인간 유전체 프로젝트(genome project) 1990년대, 한 생물체가 지닌 모든 유전정보를 완전히 밝혀 그 특성을 분석하여 규명하고자 하는 전세계적인 연구사업 인간의 염기서열을 밝히는데 있어서 가장 중요한 수단이 바이오 인포메틱스 이다. 바이오 인포메틱스는 컴퓨터를 이용해 유전체를 분석해서 상관관계나 연관성 파악하여 각 유전자들의 진화과정 및 연관정보를 예측하는 것 바이오 인포메틱스 태동 Frederic Sanger에 의해 단백질 서열결정 방법이 개발된 이후, 1960년대 부터 시작되었다고 함 유전학(genomics): 구조유전학과 기능유전학으로 구분되어 연구 프로테오믹스(proteomics): 단백질 데이타베이스 구축과 단백질 기능예측으로 구분 Slide 4 (of 16)

생물학과 다른분야와의 관계 정보기술 하드웨어 및 기계활용 수학 및 물리학적 모델활용 컴퓨터처리 실험 DNA 서열 하드웨어 및 기계활용 수학 및 물리학적 모델활용 컴퓨터처리 실험 DNA 서열 유전자, 유전체 생물체 분자 친화학 단백질 구조, 폴딩, 기능과 상호작용 대사경로 신호전달 네트워크 조절 생리학과 세포생물학 종간 상호작용 생태학과 환경시스템 방법론과 전문기술 유전체 서열결정 유전체 데이타분석 통계 유전학 단백질체학 기능 유전체학 (마이크로어레이 2D-PAGE등) 하이테크 생태학 전산 생태학 단백질 구조예측, 단백질 역학, 단백질 폴딩과 설계 복잡한 생물학적 데이터에 대한 데이터 규격화, 데이터 표현, 분석도구 동적 시스템 모델링 서열 -> 생화학 그리고 그 이상 생화학 그리고 그이상 서열 Slide 5 (of 16)

생물학과 컴퓨터 바이오 인포메틱스는 단순히 생물학과 컴퓨터의 만남 이상의 의미를 갖는 다. 컴퓨터는 생물학적 데이터를 DB화 하고, 이 DB로 부터 사용자가 원하는 정보를 얻기위한 인터페이스 설계, 웹 서비스 등을 하기위한 기반기술로써 이용된다. 생물학에서 컴퓨터 할용의 예 새로 발견한 유전자 기능에 대한 가설설정을 위해 서열비교를 하거나 단백질 폴딩(folding) 예측을 위해 단백질 3차원 구조에 대한 정보를 비트단위로 나누어 패턴검색을 할 때 사용 단백질과 대사물질이 세포안에서 어떤 작용을 하는지 예측할 때 사용 세포의 기능에 대한 모델링시 사용 생물체의 기능과 형태를 유전체 서열에 기반해 모델링 할 수 있도록 하는 역할 제공 인간 유전체 프로젝트에서 이미지 프로세싱 기법을 이용한 유전체 지도 작성 X선 결정학기술을 이용한 단백질 분석 DNA 마이크로어레이 분자생물학 기술에 컴퓨터 활용 생물학과 관련된 모든 데이터를 분류/ 목록화하여 공공 DB화 하고, 연구할 수 있는 지도(map) 작성 Slide 6 (of 16)

생물학에서 컴퓨터 역할 공공 데이타베이스와 데이터 양식의 사용 서열 정렬과 서열검색 유전자 예측 다중 서열 정렬 계통 발생 분석 서열 데이터에서의 패턴과 프로필 추출 단백질 서열 분석 단백질 구조 예측 단백질 구조 특성 분석 단백질 구조 정렬 및 비교 생화학 시뮬레이션 전체 유전체 분석 프라이머 디자인 DNA 마이크로어레이 분석 단백질체 분석 Slide 7 (of 16)

바이오 인포메틱스의 컴퓨터활용방법 * 세부 알고리즘은 교재 참조할 것: FASTA, BLAST 등 컴퓨터 활용분야 방법 컴퓨터 도구(알고리즘) 서열분석 알고리즘의 개발 유사성 비교의 원리를 사용 (측정 행렬, gap 이용) Smith-Waterman, FASTA, BLAST 염기서열의 패턴을 이용 PROSITE, LOCK, PRINT, Multiple alignment genomic project를 이용한 2차 유용 DB PEDENT, Entrez genome division, UniGene, COG 밝혀진 서열정보들의 효과적인 데이터베이스 및 생명공학을 위한 종합 정보 시스템 구축   Bioinformation catalog * 세부 알고리즘은 교재 참조할 것: FASTA, BLAST 등 Slide 8 (of 16)

생물학적 데이터와 정보소스 현재 500 여 개의 생물학 데이터베이스가 존재<표 11.2> 특정 주제에 대한 총괄적인 정보를 얻기는 불가능 통합 검색 필요 Data warehousing Indexing Middle ware system 주요 생물학 데이터와 정보소스<표 11.3> 참조할 것 Slide 9 (of 16)

NCBI의 GenBank 미국립 생명공학 정보센타(National Center of Biotechnology Information, NCBI): 미 국립보건원(National Institute of Health, NIH) 산하 기관 웹 브라우저로 메드라인(Medline) 데이타베이스 검색을 가능하게 하는 무료 서버 제공 NCBI의 GenBank(GenBank/EMBL/DDBJ) 가장 완벽한 DNA 염기서열 정보를 유지하는 유전정보 데이타베이스 유럽 EMBL(분자생물학 연합회)과 일본 DDBL(DNA Databank of Japan)와 자료교환 및 공유 주 사이트: ftp://ncbi.nlm.nih.gov 무료다운로드 가능 펍메드, 분류학 데이타베이스, 단백질 서열과 구조 데이터 접근방법 제공 각 개체, 출처, DNA 종류, mRNA로 부터 cRNA, EST에 이르는 염기서열, 유전체 염기서열 정보, 서열 다형성(sequence polymorphism) 정보 등 제공 각 연구자에 맞는 적합한 데이터 집합의 검색 가능한 점이 특징 Slide 10 (of 16)

다른 데이타베이스 SWISS-PROT PDB (Protein Data Bank) 단백질 서열만을 모으는 데이터베이스의 대표 University of Geneva의 Dr. Amos Bairoch에 의해 만들어져 오다가, 최근에는 EBI (European Bioinformatics Institute)와 공동으로 작업 PDB (Protein Data Bank) 단백질, DNA, RNA의 3차원구조를 모아놓은 데이터베이스 미국의 Brookhaven National Laboratory에서 만듦 염기열 데이터에서의 GenBank의 역할과 같은 역할을 생체분자의 구조 데이터에 대해서 수행  Slide 11 (of 16)

바이오 인포메틱스 활성화 방안 바이오 인포메틱스 기술개 발 검색 및 분석도구 개발 다중정렬 및 계통 발생학적 분석도구 개발 다중정렬 및 계통 발생학적 분석도구 개발 패턴 분석도구 개발 영상표현기술 개발 컴퓨터 구조생물학 연구 개인 유전체 프로젝트 연구 기타 컴퓨터를 활용한 연구 개발 Slide 12 (of 16)

바이오 인포메틱스 미래 <현 연구 단계> <당면과제> 현재는 연구 초기단계 필요성에 의한 참여기업 급증 데이터 축적 및 응용 모색 제약산업의 응용가능성 Chip을 통한 질병진단, 예측 개인별 유전적차이 감별 및 맞춤의약 집단유전학 및 전염병 예측, 예방 농업관련 응용가능성 작물 품질 개량 및 증산 의약용 작물 출현 환경관련 응용가능성 개량효소와 미생물을 통한 생물공정 에너지, 환경 문제에 응용 DNA computer 의 가능성 <당면과제> 필요성에 의한 참여기업 급증 제약기업, Biotech, IT 전략적제휴와 Network genomics, proteomics, microarray 생물산업의 구조와 방향이 변화 생물정보학을 중심으로 외부환경의 변화 사회적인식, 정부규제 생물정보학 인프라 발달 정보관리시스템, 분석 tool, Network 고속 대용량 시스템 요구 IBM (Blue Gene, 1억 $) DB 표준화 및 통합 XML(extensible markup language) Slide 13 (of 16)

바이오 인포메틱스의 연구방향 구조적 유전학 기능적 유전학 정상인의 표현패턴 제어 영역에서의 질병의 표현패턴 DNA 서열 과거 역 유전학 현재 전체 유전체 서열 시대 미래 후 유전체 시대 분자생물학 유전체 기술 유전학 구조적 기능적 유전학 바이오 인포메틱스 구조적 유전학 인포메틱스 tRNA의 DNA서열 제어 영역에서의 DNA 서열 정상인의 표현패턴 단백질 생상물의 유전자구조 질병의 표현패턴 서열 변이 질병과 관련된 동물 모델에서 유전자 변형 Slide 14 (of 16)

바이오 인포메틱스 연구확장 생물정보학 인프라 관리시스템, 분석 tool, Network 생명현상 탐구 데이터 정보 지식 제품 Microarray (Bio chip) Structural Genomics Functional Proteomics Pharma- cogenomics Slide 15 (of 16)

바이오 인포메틱스 응용분야 농업(식물) 제약산업(동물) 환경산업(미생물) 작물보호기술 (잡초, 병충, 병원균) 작물 생산성 및 품질 향상, 환경보전 애기장대, 쌀, 밀, 옥수수, 대두 등 Pioneer Hi-Bred(Du Pont), Monsanto, 등 미농무성 (390만$/년) 식물게놈DB(PhytoSeq, Incyte) Fruit fly 게놈(곤충 및 병충, Celera genomics) Cereon Genomics(Monsanto, Millenium P) Novatis (Functional genomics R&D) 제약산업(동물) 유전정보의 공개로 data 개발능력이 좌우 생물정보운용능력이 관건 (속도) Data mining, Knowledge discovery… Millenium Pharmaceuticals 와 Bayer 5년, 4억 6,500만 $, 골다공증, 암등 7개 질병 Lion Bioscience 와 Bayer 5년, 1억 $, 신약유전자 target Incyte Pharmaceuticals Abbott Lab., Novatis, BASF, Glaxo Wellcome, SmithKline Beecham, Bayer, Pfizer... 환경산업(미생물) Bioremediation, 산업용 효소 및 생물소재 대사 향상 효소 및 미생물 design 새로운 공정 및 제품개발 E. coli를 비롯 130여종 완료 또는 진행 중 <향후 시장규모> 시장구조 200 여개 이상의 관련회사 Genome project 연구 결과 공개 값어치 있는 연구 결과는 비공개 추세 Slide 16 (of 16)