분자생물학 데이터베이스 - 역사적인 배경 - 2006년 3월 28일 정용진
분자생물학 데이터베이스의 발전 데이터베이스 종류 데이터 내용 예 문헌 데이터베이스 서지학적 인용 온라인 간행물 Medline(1971) 사실정보 데이터베이스 핵산서열 아미노산 서열 3차원분자구조 GenBank(82),EMBL(82) PIR(1968),PRF(1979), SWISS-PROT(1986) PDB(1971), CSD(1965) 지식기반 모티프 라이브러리 분자분류 생화학 경로 PROSITE(1988) SCOP(1994) KEGG(1995)
도서목록 데이타베이스 초록, 저자, 제목, 출판자, 색인단어, 분류기호 2차 출판 목적 - 정보의 검색 - 사람들이 읽고 이해하기 위한 것
도서목록 데이터베이스 CA(Chemical Abstracts) - Chemical Abstracts Service (1907) - 화학적 문헌 BA(Biological Abstracts) - BIOSIS (1926) - 생물학적, 의학적 문헌 MEDLINE - NIH (1971) - National Center for Biotechnology Information (NCBI) (1988)
MEDLINE by NCBI 사실정보 데이터베이스와 연결 - DNA, 단백질 서열, 3차원 분자구조 온라인으로 전문을 제공하는 출판사와 연결 무료사용 가능 (인터넷)
사실정보 데이타베이스 출판된 논문들에 관련된 실험데이터 집합 컴퓨터를 이용한 분석을 위해 사용 종류 - 아미노산 서열 데이터베이스 - 3차원 구조 데이터베이스 - 핵산 서열 데이터베이스
아미노산 서열 데이타베이스 국립 생명의학 연구재단(NBRF) - Margaret Dayhoff - NBRF protein sequence database PIR (Protein Information Resource) - 1984 by NIH PRF (Protein Research Foundation) - 1979 by Japan SWISS-PROT - 1984 by 제네바대학
3차원 구조 데이터베이스 PDB (Protein Data Bank) - 실험적으로 정해진 생물학적 거대분자 들의 3차원 구조 보관 - Protein, RNA, DNA 등의 구조데이터 - 1971 by BNL RCSB (1999) CSD (Cambridge Structural Database) - 유기화합물, 금속유기화합물 3차원 구조 - 1965 by CCDC
핵산 서열 데이터베이스 GenBank - 1982 by Los Alamos NCBI (1992) EMBL Database - 1982 by EMBL DDBJ (DNA Data Bank of Japan) - 1984 International Nucleotide Sequence Database Collaboration
Flat File형식 Flat file system “파일들 사이의 관계를 지배하는 계층적 질서가 없는 파일 유지 관리 체계. 보조 기억 장치인 디스크 내에 저장되어 있는 파일은 모두 각각 다른 이름을 가져야 한다. 각각 다른 디렉터리에 존재하더라도 2개의 파일이 같은 이름을 가질 수 없다. 매킨토시운영 체계의 초기 버전이었던 매킨토시 파일 시스템(MFS)과 마이크로소프트 디스크 운영 체계(MS-DOS)의 버전 1.X 등에서 단층 파일 체계가 채용되었다. 계층적 파일 시스템(HFS)과 대칭된다.” GenBank & SWISS-PROT <그림2-2> 1) 명명법&서지학적 정보 2) Features table 3) 일차 서열 데이타
유전체 데이타베이스 생물종에 대해 특이적이며 주어진 생물종에 대한 유전적 지도, 물리적 지도, 핵산 서열, 그리고 아미노산 서열과 같은 데이터 포함 생물학적 조직 유전체 구조, 기능 표현 <표2-4> 기능 유전체학(functional genomics) DNA chip, protein chip과 접목
지식기반(Knowledge Base) 사실정보 데이터베이스 내용의 표준화의 어려움에서 시작 단순한 검색보다는 추론을 목적으로 함 : 저장된 지식으로부터 새로운 지식 생성 PROSITE (1988) SCOP (1994) KEGG (1995)