2. 분자생물학 데이터베이스 2.1 역사적인 배경 분자유전체학과 이영애.

Slides:



Advertisements
Similar presentations
RefWorks RefWorks 주요기능 참고문헌 수집과 관리 - 레퍼런스 ( 저널논문, 단행본 등의 서지정보 ) 를 온라인상에서 관리 - 국내외 학술 DB 에서 검색한 레퍼런스를 자동 저장 - 주제별 폴더를 생성하여 레퍼런스를.
Advertisements

PROQUEST MEDICAL LIBRARY 이용 매뉴얼 ProQuest 한국지사 Tel:
SIAM The Society for Industrial and Applied Mathematics Last Update : Dec.
소아아토피 피부염과 식생활 오세영 경희대학교 식품영양학과. 목차 아토피 피부염이란 ? 아토피 피부염의 발생현황 아토피 피부염의 원인 음식 알레르기와 아토피 피부염 바른 식생활이란 ?
휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science
바이오산업 Back on the Radar Screen
Award winning Business database
Gene Cloning.
Gal4-UAS System in Drosophila melanogaster
Gal4-UAS System in Drosophila melanogaster
BP 윤리실천서약서 공급하는 자(이하 “[당사/본인]”)은, 귀사와의 거래(현재 진행 중인 거래 및 장래 귀사와 체결하는 계약에 따라 진행되는 모든 거래를 포함함. 이하 동일함)와 관련하여 발생하는 비윤리 행위 및 그에 따른 책임에 대하여 아래와 같이 서약합니다. ****
GENETIC TECHNOLOGY 생물학개론 15주차 강의
RefWorks 이용 매뉴얼.
EndNote 이용법 - 레퍼런스 관리 프로그램 -.
게놈 (지놈)이란? 게놈(genome)은 유전자(gene)와 염색체(chromosome)
VectorNTI 사용법 교육 Insilicogen, Inc. Consulting Team 이 기 용.
인공지능시스템 (Artificial Intelligent)
분자생물학실험 SUBJECT Electrophoresis 결과 확인, Sequence blast
Importing GEO data into MIAME format-based information System
DNA work Protein work.
생명의 청사진 분자유전체의학 김윤경.
유전자의 발현 (Gene Expression)
분자생물학실험 Introduction.
세포생물학 Chapter 7: 핵과 DNA 복제.
해외전자정보서비스이용교육 ProQuest Medical Library ProQuest 한국지사 Tel:
.
DNA & Double Helix 3 유전학의 놀라운 비밀 - DNA! 진핵세포에 있어서의 유전정보의 흐름.
유전자 발현 분석 (Analysis of Gene Expression )
비특허문허 검색 Know-How 생명공학 분야 - 신 원 혜 생명공학심사과.
정보기술을 이용한 단백질 서열 분석 (IT-based Protein Sequence Analysis)
바이오칩의 현황과 미래 생명공학지원과 신희정.
Scopus 해외전자정보 서비스 이용교육 ELSEVIER KOREA.
Ⅲ-3. 생명의 연속성 5. 유전적 다양성과 현대의 진화
DNA에서 단백질합성까지 잼 있게 공부해! 생물교육과 이 성 현.
제 6장. 유전체 지도 작성과 지도 데이터베이스.
EndNote 정기교육 - STEP 1(2차)-
EMBASE User Guide BLITS: Getting the Best from EMBASE.com.
MD Consult 이용매뉴얼 ㈜신원데이터넷.
7. TRANSCRIPTION 오늘 제가 발표할 chapter 7에서는 Transcription 이 일어날때 관여하는 단백질의 종류와 구조를 알아보고 이것이 언제 어떻게 관여를 하여transcription이 완성되는지에 대해서 알아보도록 하겠습니다. .
Nature EBSCO Korea.
RefWorks 이용 매뉴얼.
진핵생물과 원핵생물의 차이 박진우.
Swap 추가, fsck.
IV. 단백질 합성 4.10 폴리펩티드, 아미노산 및 펩티드 결합 4.11 번역 및 유전암호 4.12 운반 RNA
8장 테이블의 생성 및 변경 정인기.
EndNote 정기교육 - STEP 2- 일자: 2012년9월4일(화) 시간: 13:00-13:30(30분) 장소: 의학도서관.
제 4 장 데이터베이스에 유전자 서열 투고하기.
돌연변이 생물교재론 양현주.
연 구 설 계.
ProQuest Medical Library (ProQuest Health & Medical Collection)
분자생물학 데이터베이스의 새로운 세대 정희준
생물분리정제공학 생명체 기본구성분자의 이해.
DNA FUNCTION AND GENE EXPRESSION 생물학개론 14주차 강의
Bio의 시대 조동성 국립 인천대학교 총장.
분자생물학 데이터베이스 - 역사적인 배경 년 3월 28일 정용진.
5. 구조 데이터베이스 구조모델: 아름답고 신기.
천연물 농·산업 빅데이터 기반 바이오 클라우드 구축: 1차 기획안 한국과학기술연구원 강릉분원 천연물 연구소
학술정보활용교육 도서관 홈페이지를 이용한 문헌검색법
원시 지구에서 단백질과 핵산은 어떻게 만들어졌는가?
R을 활용한 기초통계 2019년 3월 14일 (목) 김 철 기.
12학년 교과중심 생명공학의 기술과 이용.
EndNote.
유예 X-FILE *조사자* 1301권희원 1315이예지 1317장아정 1322홍자현.
비축사업 전자계약시스템 도입 용역 사용자매뉴얼(업체담당자용) Version 1.0.
4.2 생화학 네트워크의 원리 정 희 준.
RefWorks 이용 매뉴얼.
Scopus 해외전자정보 서비스 이용교육 ELSEVIER KOREA.
사회복지협의회와 지역사회복지협의체.
DNA로 기록된 생물정보와 정보의 활용 중심원리, 생명공학, 농업혁명.
CAJ – KNS55 (China Academic Journals)
Presentation transcript:

2. 분자생물학 데이터베이스 2.1 역사적인 배경 분자유전체학과 이영애

분자생물학 데이터베이스의 발전 - 19세기: 유전학과 세포생물학 - 20세기: 분자생물학 - 생물학의 기초적인 관찰 - 컴퓨터화된 데이터베이스 (팽창해가는 지식들의 기반)

분자생물학 데이터베이스 문헌 데이터베이스 정보 검색의 목적 도서목록과 온라인 간행물 검색 사실정보 데이터베이스 실험 데이터들의 집합 핵산 염기 서열, 단백질 서열, 3차원 분자 구조 지식 기반 저장된 지식으로부터 새로운 지식 추론을 목적 생물학적 기능들에 대한 지식 표현

<표 2-1> 분자생물학 데이터베이스들의 발전 데이터베이스 종류 데이터 내용 예 1. 문헌 데이터베이스 서지학적 인용 MEDLINE (1971) 2. 사실정보 데이터베이스 핵산서열 GenBank(1982), EMBL(1982), DDBJ(1984) 아미노산 서열 PIR(1968), PRF(1979), SWISS- PROT(1986) 3차원 분자 구조 PDB(1971), CSD(1965) 3. 지식 기반 모티프 라이브러리 PROSITE(1988) 분자 분류 SCOP(1994) 생화학 경로 KEGG(1995) 온라인 간행물

<표 2-2> 중요한 데이터베이스들의 주소 데이터베이스 기관 주소 MEDLINE 국립 의학도서관 www.nlm.nih.gov GenBank 국립 생명공학 정보센터 www.ncbi. nlm.nih.gov EMBL 유럽 생물정보학 연구소 www. ebi.ac.uk DDBJ 일본 국립 유전학 연구소 www. ddbj.nig.ac.jp SWISS-PROT 스위스 생물정보학 연구소 www.expasy.ch PIR 국립 생명의학 연구재단 www-nbrf.georgetown.edu PRF 일본 단백질 연구재단 www.prf.or.jp PDB 구조생명정보학 연구공동체 www.rcsb.org CSD 캠브리지 결정학 데이터센터 www.ccdc.cam.ac.uk

<표 2-3> 새로운 세대의 분자생물학 데이터베이스 정보 데이터베이스 주소 화합물과 반응 LIGAND www.genome.ad.jp/dbget/ligand.html AAindex www.genome.ad.jp/dbget/aaindex.html 단백질 군과 PROSITE www.expasy.ch/sprot/prosite/html 서열 모티프 Blocks www. blocks.fhcrc.org/ PRINTS www.biochem.ucl.ac.uk/bsm/dbbrowser/PRINTS/ Pfam www.sanger.ac.uk/Pfam/,pfam.wustl.edu/ ProDom protein.toulouse.inra.fr/prodom.html

<표 2-3> 새로운 세대의 분자생물학 데이터베이스 정보 데이터베이스 주소 3차원 폴드 분류 SCOP scop.mrc-lmb.cam.ac.uk/scop/ CATH www.biochem.ucl.ac.uk/bsm/cath/ 오소로그 유전자 COG www.ncbi.nlm.nih.gov/COG/ KEGG www. genome.ad.jp/kegg/ 생화학 경로 KEGG www. genome.ad.jp/kegg/ WIT www.mcs.anl.gov/WIT2 Ecocyc ecocyc.PangeaSystems.com/ecocyc/ UM-BBD www.labmed.umn.edu/umbbd/ 유전체 다양성 NCBI Taxonomy www.ncbi.nlm.nih.gov/Taxonomy/ OMIM www.ncbi.nlm.nih.gov/Omim

도서목록 데이터베이스 MEDLINE - 1971년 이후 온라인으로 이용 미국 국립보건원(NIH)의 국립의학도서관 (NLM) 통관 -1988년 국립생명공학정보센터(NCBI)로 이관된 후 분자생물학 최고의 데이터베이스 ① DNA 염기 서열, 단백질 서열, 3차원 분자구조 등의 사실 정보 데이터 베이스와 연결 ② 온라인으로 Full text를 제공하는 간행물 출판사와 연결 ③ 인터넷으로 무료로 사용 가능

아미노산 서열 데이터베이스 PIR-International Protein Sequence Database - 1968-1978년 “데이호프”가 “단백질 서열과 구조 도해서” 출판, 1980년대 NBRF 단백질 서열 데이터베이스가 시초 1984년 Protein Information Resource (PIR)이 NIH 지원으로 설립 1988년 독일 뮌헨 단백질 서열 정보센터(MIPS)와 일본 국제 단백질 서열 데이터베이스 (JIPID)와 협력

아미노산 서열 데이터베이스 Protein Research Foundation (PRF) 1975년 일본의 단백질 연구 재단 (PRE)이 “펩티드 정보(Peptide information)” 를 출판 1979년 전산화한 데이터베이스SEQDB와 LITDB 제작 아미노산 서열을 서지학적 정보 부분으로 다룸

아미노산 서열 데이터베이스 SWISS-PROT 1986년 제네바대학에서 제작 데이터의 질적인 면에서 최고 1987년 유럽 분자 생물학연구소(EMBL)과 협력하여 뉴클레오티드 서열 데이터베이스를 번역하여 보완 현재 스위스생물정보학협회(SIB), EMBL의 유럽생물정보학협회 (EBI)와 공동으로 운영

3차원 구조 데이터베이스 Protein Data Bank(PDB) 1971년 북하벤 국립연구소(BNL)에 설립 1999년 구조생물 정보학 연구협력 기구(RCSB)가 운영 - 단백질, RNA, DNA, 탄수화물, 분자 합성물, 바이러스 구조 정보 Cambridge Structural Database(CSD) 1965년 캠브리지대학에 설립 1989년 캠브리지 결정데이터센터(CCDC)에 의해 유지 서지학적, 화학적, 결정학적 데이터와 X-레이, 중성자 회절방법에 의한 3차원 분자좌표 데이터를 포함

뉴클레오티드 서열 데이터베이스 GeneBank -1982년 로스 알라모스 국립연구소 EMBL DDBJ -1992년 NCBI로 이관 EMBL 1982년 유럽 분자생물학 연구소 1994년 EBI로 이관 DDBJ -1984년 일본 DNA 데이터 은행 이들 세 기관이 “국제 뉴클레오티드 서열 데이터베이스 협력기구” 결성하여 매일 데이터를 교환

<그림 2-1> (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식 핵산 서열, 단백질 서열, 3차원 분자 구조 데이터베이스에 널리 사용 데이터 처리 및 이용이 쉬움 서열 데이터베이스 등록자료 내용 ① 명명법, 서지학적 정보 ② 서열 특성에 대한 생물학적 주석을 포함한 특징표 ③ 일차 서열 데이터

GeneBank의 서열데이터베이스 LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION D.melanogaster decapentaplegic gene complex (DPP-C), complete cds. ACCESSION M30116 VERSION M30116.1 GI:157291 KEYWORDS . SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Ephydroidea; Drosophilidae; Drosophila. REFERENCE 1 (bases 1 to 4001) AUTHORS Padgett,R.W., St Johnston,R.D. and Gelbart,W.M. TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099), 81-84 (1987) PUBMED 3467201 COMMENT Original source text: D.melanogaster, cDNA to mRNA. The initiation codon could be at either 1188-1190 or 1587-1589. FEATURES Location/Qualifiers source 1..4001 /organism="Drosophila melanogaster" /mol_type="mRNA" /db_xref="taxon:7227" mRNA <1..3918 /product="decapentaplegic protein mRNA" CDS 1188..2954 /note="decapentaplegic protein (1188 could be 1587)" /codon_start=1 /protein_id="AAA28482.1" /db_xref="GI:157292" /translation="MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLA……LGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR" ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg …………. 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g //

SWISS-PROT의 서열 데이터 베이스 Features ……….. Sequence information ………….. Entry information Entry name DECA_DROME Primary accession number P07713 Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6 Integrated into Swiss-Prot on April 1, 1988 Sequence was last modified on September 13, 2005 (Sequence version 2) Annotations were last modified on     March 21, 2006 (Entry version 66) Name and origin of the protein Protein name Protein decapentaplegic [Precursor] Synonym Protein DPP-C Gene name Name:  dpp ORFNames:  CG9885 From Drosophila melanogaster (Fruit fly)  [TaxID: 7227] Taxonomy Eukaryota ; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Ephydroidea; Drosophilidae; Drosophila. References [1] NUCLEOTIDE SEQUENCE [MRNA]. DOI=10.1038/325081a0; PubMed=3467201 [NCBI, ExPASy, EBI, Israel, Japan] Padgett R.W., St Johnston R.D., Gelbart W.M.; "A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family."; Nature 325:81-84(1987). Features ……….. Sequence information …………..

유전체 데이터베이스 - 생물 종에 대한 유전적 지도, 물리적 지도, 핵산 서열, 아미노산 서열과 같은 여러 종류의 데이터를 포함 다양한 해상력에서의 유전체 구조 다양한 단계에서의 유전체 기능 유전자 기능에 따른 계층적 분류 DNA 칩, 단백질 칩과 같은 실험 방법들로부터 얻은 새로운 종류의 발현 데이터들과 통합 발전

<표 2-4> 라일리(Monica Riley)에 따른 대장균(E. coli) 유전자들의 기능적인 분류