프로테옴 데이터 분석을 위한 바이오인포매틱스 기술 2002. 11. 5. 한국기초과학지원연구원 프로테옴분석팀 권 경 훈 khoon@kbsi.re.kr
목 차 프로테오믹스 단백질의 질량스펙트럼 탄뎀 질량스펙트럼 프로테옴 데이터베이스 시스템 ICAT 방법에 의한 프로테옴 정량분석
프로테옴 (Proteome), 프로테오믹스 (Proteomics) Protein + ome = Proteome 특정 세포나 특수 상황에서 만들어지고 작용하는 단백질들의 총합 프로테오믹스(Proteomics) 환경이 바뀜에 따라서 단백질들이 어떻게 생성되고 변화하며 어떻게 상호작용하는가를 연구
Information Technology Omics 와 informatics Biotechnology Genomics Proteomics Metabolomics Genome informatics Proteome informatics Metabolism informatics Bioinformatics Information Technology
Characterization of proteome Omics 의 관계 Molecular machinery of cellular processes metabolomics Characterization of proteome 1989 Peptide mass fingerprinting 1986 peptide sequencing by MS/MS proteomics Genome sequencing genomics
Proteome informatics 단백질 동정 기술 통합 Database 구축 단백질 기능, 구조 분석 System biology
프로테오믹스 단백질의 질량스펙트럼 탄뎀 질량스펙트럼 프로테옴 데이터베이스 시스템 ICAT 방법에 의한 프로테옴 정량분석
프로테옴 데이터 electrophoresis Mass spectrometry Database search 단백질 분리 펩타이드 분자량 측정 단백질 동정
단백질의 질량 스펙트럼 Protein database Peptide sequences Protein id 질량분석기 효소 질량분석기 MS spectrum 단백질 Protein database Peptide sequences Protein id A B A B
Mass spectrum (peptide mass fingerprint) intensity 422.25 692.35 1096.59 1451.75
Mass spectrum vs. database Protein A Protein B Protein C
Peptide mass match ….FNSTPKYIKSEGYGPREKYQSRPKFNSTPKDYN… Mass spectrum intensity Spectrum of a protein in DB FNSTPK YIK YQSRPKFNSTPK FNSTPKYIK 422.25 692.35 1096.59 1451.75 Tolerance ?
단백질 데이터베이스 non-redundant protein DB 효소: trypsin Protein mass (0-150kDa) Peptide mass (0-12.5kDa)
PMF search programs MS-Fit MASCOT PeptIdent PeptideSearch http://prospector.ucsf.edu/ MASCOT http://www.matrixscience.com/ PeptIdent http://www.expasy.org/ PeptideSearch http://www.mann.embl-heidelberg.de/
MS-Fit
아미노산 분자량 아미노산 기호 MW (Da) Alanine A 71.03711 Methionine M 131.04049 Cysteine C 103.00919 Asparagine N 114.04293 Aspartic acid D 115.02694 Proline P 97.05276 Glutamic acid E 129.04259 Glutamine Q 128.05858 Phenylalanine F 147.06841 Arginine R 156.10111 Glycine G 57.02146 Serine S 87.03203 Histidine H 137.05891 Threonine T 101.04768 Isoleucine I 113.08406 Valine V 99.06841 Lysine K 128.09496 Tryptophan W 186.07931 Leucine L tyrosine Y 163.06333
Peptide mass fingerprint 의 한계 Mass tolerance 내에서 분자량이 일치하는 아미노산 서열을 찾아야 함. modification 문제 대부분의 경우 여러 단백질을 검색 결과로 얻으므로 검색결과의 신뢰도가 문제 발생. 확인 과정 필요 많은 양의 프로테옴 데이터 검색을 위해서는 batch 작업이 필요함.
PMF search results 통계
프로테오믹스 단백질의 질량스펙트럼 탄뎀 질량스펙트럼 프로테옴 데이터베이스 시스템 ICAT 방법에 의한 프로테옴 정량분석
탄뎀 질량 스펙트럼 (MS/MS spectrum) energy 효소 1st MS 2nd MS 단백질 MS spectrum Peptide sequence Protein id Protein database Tandem MS spectrum
탄뎀 질량 스펙트럼 Peptide fragmentation x3 y3 z3 x2 y2 z2 x1 y1 z1 H2N COOH R1 C H O N R2 R3 R4 a1 b1 c1 a2 b2 c2 a3 b3 c3
단백질 동정 (protein identification) intensity Peptide 의 탄뎀 질량 스펙트럼 compare m/z intensity a spectrum of a peptide in database m/z
modification K K E T E T oxidation M M P P I I M M A A
MS/MS Search programs MASCOT http://www.matrixscience.com/ MS-TAG http://prospector.ucsf.edu/ SEQUEST http://fields.scripps.edu/sequest/
MASCOT
MASCOT output
Sequencing intensity …EDCBA …DECBA A B C DE m/z b1 y1 y2 y3 y5 b7y7 b12 y9 y10 y12b17 y18a22
BLAST
Scores Homology search (BLAST) alignment score e-value Peptide Mass Fingerprint Number of matched peptides Coverage MOWSE score Probability based on MOWSE score Tandem mass search Cross-correlation coverage
프로테오믹스 단백질의 질량스펙트럼 탄뎀 질량스펙트럼 프로테옴 데이터베이스 시스템 ICAT 방법에 의한 프로테옴 정량분석
Proteomics Trends High-throughput Proteomics 2. Quantitation High-throughput automated identification of proteins 2. Quantitation Quantitation of relative protein abundance
Proteome Database System for High-Throughput proteomics Proteome DB server Data management system instrument Mass spectrometer Mass spectrometer Mass spectrometer Mass spectrometer Mass spectrometer Mass spectrometer Mass search program database swissprot nr EST user Web server user user
프로테오믹스 단백질의 질량스펙트럼 탄뎀 질량스펙트럼 프로테옴 데이터베이스 시스템 ICAT 방법에 의한 프로테옴 정량분석
Quantitation: ICAT (Isotope-coded Affinity Tag) 정량적 단백질 발현 분석의 혁신적인 방법 서로 다른 환경에서 발현된 단백질들을 비교하는 정량적 분석 방법 2D gel 의 단점 보완 실험의 반복성 구현 실험 소요시간 단축 (1 week/exp.) membrane protein 분석 가능 작은 분자량의 단백질 측정
ICAT 방법에 의한 프로테옴 정량분석 Sample 1 Mass spectrometry Sample 2 Labeled at Cysteines Sample 1 Sample 2 d8 d0 Pool of labeled proteins Mass spectrometry Digest and purify
단백질 동정 (ICAT) Mass spectrum Tandem Mass spectrum
KBSI 프로테옴 DB 서버 구축 (KISTI 위탁과제) Java MySQL DB MALDI/TOF-TOF perl PHP File system ESI/Q-TOF Web server 데이터 입력 시료정보 스펙트럼 데이터 단백질 검색정보 user
한국기초과학지원연구원 프로테옴분석팀 김승일 박사 : 팀장 : 2D-gel Post doc. : 박영목 박사 : 프론티어 과제 수행 유종신 박사 : 선임부장 : 질량분석 김수현 박사 : 탄수화물 분석 정영호 박사 : 형광분석기기 김영환 박사 : MALDI/TOF-TOF 최종순 박사 : DNA sequencing system 김진영 박사 : LC/MS, ESI/Q-TOF 조 건 : Tandem Mass 권경훈, 김미옥 박사 : informatics Post doc. : 안영희, 김영혜, 권수미 위촉연구원 : 김재우, 이정화, 전영선, 황수경, 권금녀, 김경욱,김수정, 김은아, 문윤정, 박영재, 박은정, 송승열, 유용철, 이경민, 이영재, 이용주, 이은미, 조미선, 조옥기, 정미영,
감사합니다. Proteome Informatics 교육 안내 실험실용 Protein Informatics 시스템 개발 교육 12월 3일(화) 오후 1:00 – 5: 30 장소: 한국기초과학지원연구원 (대전본원) ( http://www.kbsi.re.kr/ )