프로테옴 연구동향과 정부의 정책방향 1. INTRODUCTION: Proteomics Tech Overview 백 융 기 Yonsei Proteome Research Center, Yonsei University, Seoul, Korea
Proteome vs. Proteomics 프로테옴 (Proteome) vs 프로테오믹스 (Proteomics) 연구대상 (Targets) 연구수단 방법 (Tools) Human (HPP) Animals Plants Microbials 2-DE, ICAT MALDI-Mass Proteome Informartics Protein Sturcture 규명 (NMR, X-ray, etc) Applications 질병 진단 및 치료 생물자원발굴 신의약 개발 신품종 개발 유전자 기능 이해 기능성 식품 개발 등
Some Facts: Why proteomics ? Less than 2 % of our total disease load are monogenic diseases. There is very low correlation between mRNA abundance and protein level. (e.g., yeast –S. cerevisiae: <0.5 correlation factor) Gene products are modified by – complex gene interactions – cellular events – environmental influences (co- & post-translational modifications: >189 types)
Proteomics differential display protein identification protein characterization protein-protein interactions Pathway i.d./elucidation protein function standard 2D gel approach molecular scanner cell/tissue imaging Structural Proteomics Functional Proteomics
Structural Proteomics: Identification and Characterization normal samples diseased samples serum, CSF… ± drug time-course 7-DHCR ApoE 14-reductase SamplesSeparationIdentification 1000s of samples =1000s of gels 1000s of proteins/gel IEF MW Digestion proteins
Principle of 2-D Electrophoresis 1. First dimension: denaturing isoelectric focusing separation according to the pI 2. Second dimension: SDS electrophoresis separation according to the MW The 2-D electrophoresis gel resolves thousands of protein spots each time.
Spec #1=>BC=>NF0.7[BP = , 9632] MALDI-TOF-MS spectra obtained from tryptic digestion of actin excised spot
프로테오믹스 생물정보학 (Proteome Bioinformatics) 의 적용범위 Experimental protocol, fractionation, lab procedures. Experiment Species, tissue, cell, etc. Sample Source Pathology, age, date, individual history, treatments, etc. Sample Condition Spot location, Mr, pI, expression level, post-translational modifications, specific labeling. Differential expression across multiple gels. Gel Electrophoresis Protein spot selection, excision, Enzymatic digestion, solid phase extraction. Material, progress tracking. Sample Selection, Preparation Machine running conditions, spectra, spectra selection, peak list generation. MALDI peptide fingerprinting, database search. MS/MS, spectra selection. Sequence generation and database search. Mass Spectrometry Reference database record, sequence, annotations, citations. Protein Identification Protein Characterization and Function Proteome Informatics
ExPASy 는 Swiss Geneva 에 위치한 SIB (Swiss Institute of Bioniformatics) 에서 운영중인 Proteomics tools (D/B) 의 service sever 임. ExPASy 는 현재 많은 연구자들의 프로테옴 관련 연 구에 있어 필수적인 데이터베이스로 인정받고 있음. 한국에서는 2001 년도에 들어 접속수가 폭발적으로 늘어나고 있음. ExPASy Molecular Biology Server
연세프로테옴연구센터 (YPRC) 프로테옴분석사이트 운영개시 (kr.expasy.org) 2001 년 2 월 13 일 SIB (Swiss Institute of Bioinformatics) 의 ExPASy Mirror Site 를 연세프로테옴연구센터에서 운영개시함으로써 한국의 프로테오믹스의 생물정보 학수준을 다른 선진국들과 경쟁하는 대열에 참여케 되었음. 국내 연구자들을 위한 실시간 프로테옴 생물정보 분석시스템의 확보 Human Proteome Project 에 참여 가능성 제고 ExPASy Mirror Sites 호주 APAF 대만 국립보건원 카나다 CBR 중국 베이징대학 대한민국 YPRC
YPRC 의 ExPASy 유치 및 시험운영 연세프로테옴연구센터에서 지난 2 월 13 일 부터 ExPASy Mirror Site 운영중 시험운영 결과 : 작년 평균 접속 대비 435% 신장 ( ) 월평균 :>200,000 건
ExPASy 시험운영 결과
II. Proteomics applications, examples Studies of basic cell function and molecular organisation The discovery of novel drug targets The discovery of novel biologically active molecules and drugs Subtype individuals to predict response to therapy The discovery of molecular markers for diagnosis and monitoring disease The study of drug modes of actions and mechanisms of toxicity The molecular dissection of genetic or pharmacological perturbations Investigations of pathophysiology
프로테오믹스 관련 미국 특허사례 USP 6,084,069, Autotaxin: motility stimulating protein useful in cacner diagnosis and therapy USP 6,027,905, Methods for the detection of cervical cancer USP 5,914,238, Materials and methods for detection of breast cancer (2DE etc) USP 5,792,744, Proteins from mammalian liver USP 6,127,134, Different gel electrophoresis using matched multiple dyes USP 6,165,709, Methods for drug target screening USP 5,976,543, 12-kDa protein derived from M. Tuberculosis useful for treatment of autoimmunie disease USP 6,229,911, Methods and apparatus for providing a bioinformatics database
III. Future Directions Automations: Robotics Highthroughput : PCR-version of proteins? -2DE 대체 기술 (ICAT, Flu-dye tech etc) Integrated Data Base System -LIMS (SQL4, Worksbase, YPRC-PDB etc) Regional Cooperations (e.g., AOHUPO) Public Sector vs Private Companies -[NIH, MIT HGP Gr.] vs [Celera Genomics, LSB, OGS] Funds 1 W. P. Balckstock, M. P. Weir, TIBTECH, p , March J. E. Celis, Electrophoresis, 12, , 1995.
New Trends in Proteomics Automation - High-throughput processing of spot cutting - Enzyme Digestion, Molecular Scanner - Sample Cleanup - Robotics Data Management - LIMS, WorksBase
Isotope–Coded Affinity Tags ICAT™ Breakthrough approach to quantitative protein expression analysis - 2D gel alternative Currently in Development Test Kits available December with ProICAT SW for Qstar Pulsar Kit launch in early 2001 reactive groupbiotin taglinker (heavy or light) heavy reagent: d8-ICAT (X=deuterium) light reagent: d0-ICAT (X=hydrogen) S HN NH O NHNH O O NHNH I O O X X X X X X X X SHSH cys Label & Quantify Emerging Technology
Mixture 1 Protein Quantification & Identification w/ICAT Determine differences in protein expression by measuring relative intensities of light vs. heavy Slide courtesy of Ruedi Aebersold Quantitation Identification MS MS/MS
New Trends in Proteome Informatics High-throughput Data Quality Data Management-Consistency Data Exchange, DB, Standard Annotation Data Mining
IV. 인간 프로테옴 프로젝트 -Human Proteome Project- Is Human Protoeme Project Next? (The Scientists, April 2, 2001) The Protoeme isn’t genome II (Nature, 410, 725-, 2001) In Hot Pursuit of the Proteome (Wall Street J., April 5, 2001) “Goodbye race to decode the human genome; Hello race to decode human proteome” (Time, Feb. 18, 2001)
Human Genome Project 결과로 파생된 새로운 문제들 1. 인간프로테옴프로젝트는 과연 다음의 Global Project 인가 ? -Is Human Proteome Project Next? (The Scientists, April 2, 2001) 2. 어떻게 4 만개 이내의 단백질로 인간의 생체기능을 조절하는 가 ? 3. 인간세포내 구조가 각기 다른 단백질수는 얼마인가 ? 4. 발생단계별, 조직별, 생리상태별 달라지는 단백질을 어떻게 분석할 것인가 ? 5. 각 단백질 상호관계는 ?
HPP vs HGP (Part I) HPPHGP 주도국가 유럽, 미국, 호주 등 Global Project 한국 참여 미국주도의 극소수 국가 한국 불참 연구대상 아직 숫자가 결정되지 아니한 전체 단백질 대상 연구 전체 데이터의 양 예상 ( 게놈 데이터의 1,000 배 이상 ) 한정된 24 개 염색체 유전자 조사 RACE 형태의 포화성연구 최종목표 각 조직별, 세포별, 질환군별, 발 생과정별 단백질의 정량적 분포와 변화 규명 단백질의 3 차원구조 결정 단백질간 Network 규명 유전자 지도 및 서열 규명 SNP 수 예측 유전자 변형유무, 유전자수, 염색체 크기 등 규명 과제성공요건 PCR 에 상응하는 샘플증폭장치 High-throughput, 자동화 기술 개발 절실 대량복제기술인 PCR 가능 자동화된 염기서열분석기술
HPP vs HGP (Part II) HPPHGP 주요 핵심기술 이차원 단백질 전기영동분석 MALDI-Mass ( 단백질 질량분석 ) 프로테옴 생물정보학 Cloning 기술 자동화된 염기서열분석 기술 게놈 생물정보학 상업적 가치 새로운 단백질의 발굴과 기능분 석연구결과의 특허, 신약개발 등 에 직접 이용가능 Proteome DB 의 상업화 유전자 서열이나 EST 자체에 대한 특허성 논란 유전자 DB 는 이미 상용화 한국의 공헌여지 연구대상의 광역화와 기초연구 력이 탄탄하여 충분히 기여 가능 시기적으로 미성숙 기술개발단 계이 기회 상실
Human Proteins 38,000 – 43,000 proteins predicted (Based on ORF) Actual Proteins : 43,000 x 10 ~ 20 = 1 ~ x10 6 proteins (due to Post-Translational Modifications) (Source : Swiss Prot, ExPASy etc.) Currently only <10,000 proteins identified (< 1.0%) More than 99 % of total human proteins unknown.
Where is this market opportunity coming from ? Completion of Human Genome Project, funding is going to Proteomics. Enable development of drugs for previously untreatable diseases. Big Pharma and biotechs must accelerate drug develop ment to maintain current valuations therefore using high throughput systems.
How the Investors view proteomics? ( 자료 : Perseus LLC, 2001) 1.Data will be very valuable 2. Proteins are where the action will be 3. Large number of companies 4. No clear leader yet 5. Diverse complex approaches 6. Further technology develpoment required
Business Model for Proteomics Target Discovery (+++++) - 예, drug target, 마커단백질, 지표인자, 생체 조절물질등 Tools Providers: MS, LC, 2DE, CE etc. (+) Proteomic Database(+++)
시장 점유율 (Huge Market Opportunities) ( 자료 : Genomic Solutions, 2001) BiochipProteomics 2001 년도 56 억불 44 억불 2005
Proteomics 주요 회사 미국유럽 Drug Target Celera Genomcis Cura Gene Incyte Genomics Large Scale Biology Myriad Genetics GeneProt Glaucus Proteomics Hybrigenics OGS Instruments Systems Applied Biosystems, Bio-Rad MDS Proteomics Micromass Amersham Pharmacia 3D Structure Integrative Proteomics Structural Genomics 전자 회사중 관련회사 IBM Hitachi ( 일본 ) NEC ( 일본 ) Motorola
HUPO 의 결성목적 ( ) 1.Global Project 인 HPP 의 지역간, 기관간, 산 학 연간의 협력 증진 2. 연구기금 조성 (World Bank, NIH, Welcome Trust Fund etc) 3. 연구분야별 분담 조정 역할 (Tissue, Blood, Body fluids etc) 4. HPP 결과의 공용화 추진 (Public Domain 공개 ) Homepage 를 통한 DB 운영 각종 주요 정보 제공 5. 전체 단백질의 구조 - 기능규명 공동작업의 효율화
세계의 프로테옴 연구권 HUPO 덴마크 그룹 미주그룹 호주 그룹 일본 그룹 (Jap HUPO) 한국 그룹 (KHPC) 네델란드그룹 스웨덴 스위스 그룹 독일, 프랑스 영국 그룹 7-6.
HUPO 에서의 한국연구진들의 역할 1.HPP 과제 수행을 통한 실질적인 인간프로테옴 DB 구축에 기여 2.HUPO Homepage ( 운영을 통한 각종 프로테옴 관련 정보의 DB 구축, 분배, 수집 역할 3. 프로테옴 연구의 Asia Oceanian HUPO 구축, 지역 연대 구축의 중심 한국 - 호주 - 일본 - 중국 - 타이완 - 싱가폴 - 인디아 - 뉴질랜드 4. 주요 결정과정에 참여, 의견 개진, 선도적 역할 5. 한국연구자의 연구결과 신속한 홍보, 첨단기술의 공유와 축적 6. 세계적인 프로테옴네트웍의 구축에 국내연구자 참여촉진
Global Project-HPP 를 수행하는 중요한 이유 1.One gene = > 10 proteins PTM (Post-Translational Modification) Isoforms Cell or Tissue-specific expressions 2.> 1 x 10 6 proteins in Human (Predicted) 3.Annotation 뿐 만 아니라, 구조 - 기능 규명작업의 병행이 필수 4. 인간 Genome 처럼 시작과 끝이 미리 정해져 있지 않고, 작업의 saturation point 예측 불가 5. 신규성 단백질 (Novel protein) 의 다양한 patent 화 가능성 Druggable / Diagnostic / Therapeutic / Regulatory Proteins 6. 게놈 프로젝트의 공헌기회 상실을 훌륭하게 대신해 줄 수 있는 기회 부여 ►► 첨단기술 축적 및 공유 7. 집약적이고, High-throughput 개념의 목표지향적 과제수행의 필요성 대두
한국인간프로테옴콘소시움의 설립목적 (The Korean Human Proteome Consortium : KHPC) 7 월 24 일부 공식발족 예정 ( 과기총회관 ) 각종 글로벌 프로테옴 연구를 효율적으로 수행하기 위한 산학연 공동 협력체제 의 구축 제한된 인적자원, 연구기반시설 및 기자재 활용의 극대화 촉진 고급 프로테옴 분석정보와 분석 tool 의 공유를 통한 비용 절감, 연구결과의 산업화 촉진 상호 중복과제 수행방지, 목표지향적 효율적인 연구수행 촉진 세계적인 프로테옴 연구그룹과의 공동협력과 연구자원 공동활용 촉진 프로테옴 DB 구축과 Annotation 에 참여국 책임량 공동 달성 연구기금 확보를 위한 공동 노력 인적자원 / 연구인프라 파악분석 필요기관제공, 학제간 연구 촉진 < 발기위원 : 30 명 정도로 결성 (Advisory Council):
한국의 프로테오믹스 연구인력 현황 1 차 마감일 : 일 현재 BRIC 을 통한 자발적 참여자 대상 한국인간프로테옴콘소시움 창립발기위원회
분야별 분포 ( 총 222 명 중 ) 147 명 41 명 34 명
전공별 분포 ( 총 222 명 중 ) 30 명 24 명 20 명 41 명 45 명 69 명
학력별 분포 ( 총 222 명 중 ) 139 명 40 명 30 명 14 명
프로테오믹스 관련 연구주제별 분포 ( 총 222 명 중 )
참여자의 프로테옴 분석 대상별 분포 ( 총 222 명 중 )
프로테오믹스 연구에 필요한 기자재 혹은 인 프라 분야별 분포 ( 참고 :MALDI 보유 : 총 25 대 )
프로테옴연구에 대한 정부의 정책방향 연구인력, 연구비, 인프라 구축의 현 주소 파악 – 연구인력의 가용성 – 단기 교육훈련을 통한 전문가 양성 – 프로테옴 정보인프라, 기자재 관련 인프라 보강책 다른 나라와 다국적 산업체의 대응방안 검토 지역간 프로테옴 네트웍 형력 지원 ( 예, AOHUPO) 효율적인 정책방향 – 범 부처적, 공통과제로 인식, Task-force 구성 ( 유럽, 일본은 이미 구성 및 운 영중 ) – 콘소시움 구성, 산학연 역할 분담 – 집중적이고 장기적인 지원대책 – 기존의 유사과제와 시너지 효과 발휘하게 지원
환경오염지표물질 발굴 해양생물의 프로테옴 DB 우수형질가축개발 가축병의 프로테옴분석 산업기반기술 프로테옴정보인프라구축 전문인력양석 질병관련 프로테옴 한국인 희귀질환 각종 진단마커단백질 중앙프로테옴센터 기초 핵심기술개발 공통기술지원센터 특이 표적 지향성 과제수행 ( 프론티어사업 ) 프로테옴연구 과학기술부 보건복지부산업자원부 환경부, 해양부농림부 부처별 역할 분담안 : 재원 활용의 극대화
결론 및 전망 : 인간프로테옴연구 글로벌과제 성격의 인간 프로테옴프로젝트 (HPP) 의 수행에 한국의 참여명분과 위상이 충분히 확보되었음. 효율적인 HPP 의 수행을 위한 정부의 신속한 대응책 – 범 부처적인 Task-force 구성, 종합대책 마련 – 장기간의 예산 확보 : 20 년 이상 – 초대형 국책과제로 수행 – 산학연 콘소시움 형태로 효율성 제고 – 연구인력 양성, 연구 인프라 구축에 과감한 투자 – 관련 과제와의 시너지 효과 창출 –( 과기부의 프론티어, 복지부의 유전체사업, 산자부의 차세대사업등 ) HPP 결과의 파급효과 확산, 국민 계몽