제 4 장 데이터베이스에 유전자 서열 투고하기.

Slides:



Advertisements
Similar presentations
일정 관리 다이어리 제작 JSP Programming with a Workbook. 학습 목표  사용자의 일정을 관리할 수 있는 다이어리에 대하여 알아보자. JSP Programming with a Workbook2.
Advertisements

프로그램이란 프로그램 생성 과정 프로젝트 생성 프로그램 실행 컴퓨터를 사용하는 이유는 무엇인가 ? – 주어진 문제를 쉽고, 빠르게 해결하기 위해서 사용한다. 컴퓨터를 사용한다는 것은 ? – 컴퓨터에 설치 혹은 저장된 프로그램을 사용하는 것이다. 문제를 해결하기 위한.
프로그래밍언어론 TA 윤들녁. 소개 윤들녁 연락처 : 공대 7 호관 4 층 401 호 데이터베이스 연구실 실습 후 날짜 _ 학번.zip 으로.
을지대학교 무선 네트워크 사용 방법 2010 년 06 월 01 일. 을지대학교 무선 네트워크 사용 방법 1. PC 무선랜 카드 활성화 및 체크 1 단계 : 시작 -> 설정 -> 네트워크 설정 2 단계 : 무선 네트워크 설정 선택 -> 마우스 버튼 오른쪽 클릭 -> 사용.
오토베이스9 태그 편집기를 이용한 태그 편집 오토베이스 교육센터.
MS SQL Server 학기, 소프트웨어 설계 및 실험 ( Ⅰ )
김태원 심재일 김상래 강신택. 김태원 심재일 김상래 강신택 인터넷 통신망의 정보를 제공하는 서비스 인터넷의 자원 및 정보는 NIC가 관리 IP주소 또는 도메인으로 정보 검색 이용자 및 통신망 관한 정보를 제공.
1. 신뢰할 수 있는 싸이트 등록 인터넷 익스플로러 실행 후 실행
MS-Access의 개요 1강 MOS Access 2003 CORE 학습내용 액세스 응용 프로그램은 유용한 데이터를
SAS Foundation Client 9.4 설치 가이드
2. 분자생물학 데이터베이스 2.1 역사적인 배경 분자유전체학과 이영애.
인공지능시스템 (Artificial Intelligent)
Windows 8 Ksystem G&I 설치.
5장 Mysql 데이터베이스 한빛미디어(주).
4장. 웹로직 서버상에서의 JDBC와 JTA의 운용
㈜학술교육원 온라인논문투고시스템 심사자 메뉴얼.
회원가입을 클릭하시면 학회홈페이지 회원가입페이지로 이동합니다.
회원가입 클릭.
CHAPTER 02 OpenCV 개요 PART 01 영상 처리 개요 및 OpenCV 소개.
Root Filesystem Porting
컴퓨터과학 전공탐색 배상원.
Root Filesystem Porting
                              데이터베이스 프로그래밍 (소프트웨어 개발 트랙)                               퍼스널 오라클 9i 인스톨.
EBRARY 이용방법.
회원가입 클릭.
5장 Mysql 데이터베이스 한빛미디어(주).
11장. 1차원 배열.
제 1장. 멀티미디어 시스템 개요.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
Method & library.
프로그래밍 개요
박성진 컴퓨터 프로그래밍 기초 [09] 배열 part 1 박성진
2장. JSP 프로그래밍을 위한 환경구성 제2장.
강의 개요. 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
2015학년도 PHP 기말 레포트 로그인 홈페이지 제작.
2장. 데이터베이스 관리 시스템 데이터베이스 관리 시스템의 등장 배경 데이터베이스 관리 시스템의 정의
PRM 정보관리 업체 메뉴얼
Cell 해외전자정보 서비스 이용교육자료.
Chapter6 : JVM과 메모리 6.1 JVM의 구조와 메모리 모델 6.2 프로그램 실행과 메모리 6.3 객체생성과 메모리
ASP.NET AJAX / AJAX Control Toolkit 응용 2008 컴퓨터공학실험( I )
8장. spss statistics 20의 데이터 변환
1. 신규업체 등록신청 Menu Path HOME >> 신규업체등록신청 화면 개요
Duke Univ. Press 마지막 업데이트:
고등학교 생물 학습자료 이 자료는 고등학교 ‘생물’ 의 “생명의 연속성” 단원에서 세포 분열에 관한 수업을 위한 것입니다.
CHAP 21. 전화, SMS, 주소록.
ULRICHSWEB ㈜신원데이터넷.
네트워크 환경 구축과 이미지 전송 호스트/타겟 통신 직렬 통신을 이용한 이미지 전송 수퍼 데몬 BOOTP 환경 구축
알고리즘 알고리즘이란 무엇인가?.
STS 에서 웹 서버 설치 방법.
OpenCV 설정 2.21 만든이 딩딩.
단축키 기능 1. 단축키 기능 설명 Alt + R 조회 S 저장 I 삽입 A 추가 D 삭제 P 출력 Q 닫기
분자생물학 데이터베이스 - 역사적인 배경 년 3월 28일 정용진.
The American Physiological Society
01. 분산 파일 시스템의 개요 네트워크에 분산된 파일을 사용자가 쉽게 접근하고 관리할 수 있게 해준다.
멀티미디어시스템 제 4 장. 멀티미디어 데이터베이스 정보환경 IT응용시스템공학과 김 형 진 교수.
DNA의 구조와 역할 (1) DNA : 이중 나선 구조로 수많은 뉴클레오타이드의 결합으로 이루어져 있다.
11장 배열 1. 배열이란? 1.1 배열의 개요 1.2 배열의 선언과 사용.
가천대학교 생명과학과 생물학 및 실험 학기 생물학 및 실험 1 Exp 10. DNA의 구조.
서울대학교 S-space 사용을 위한 간편 매뉴얼
서적DB개발 과제 Page 2의 ERD를 통해 구축할 서적 DB의 구조를 파악한다. (4개의 개체에 대해 확인함)
JSP Programming with a Workbook
TrustNet 전자 협조전 사용설명서 목 차 작성,수정,삭제 결재함 처리현황 발송대장,접수대장
1장 C 언어의 개요 C 언어의 역사와 기원 C 언어의 특징 프로그램 과정 C 프로그램 구조 C 프로그램 예제.
 6장. SQL 쿼리.
체크 V 부가세포함 총분양금액 계약서작성일 견적서 참조 분양면적 ㎡ 예약금 입금액 추가금 입금일 입금자명 계약금10%
펌웨어(S/W) Upgrade 방법 Samsung Kies3
6 객체.
생명의 청사진 분자유전체의학 김 경 원.
Chapter 11. 문서 인쇄 및 파일 형식.
Presentation transcript:

제 4 장 데이터베이스에 유전자 서열 투고하기

분자생물학 데이터베이스의 발전 - 19세기: 유전학과 세포생물학 - 20세기: 분자생물학 - 생물학의 기초적인 관찰 - 컴퓨터화된 데이터베이스 (팽창해가는 지식들의 기반)

분자생물학 데이터베이스들의 발전 데이터베이스 종류 데이터 내용 예 데이터베이스 종류 데이터 내용 예 1. 문헌 데이터베이스 서지학적 인용 MEDLINE (1971) 2. 사실정보 데이터베이스 핵산서열 GenBank(1982), EMBL(1982), DDBJ(1984) 아미노산 서열 PIR(1968), PRF(1979), SWISS- PROT(1986) 3차원 분자 구조 PDB(1971), CSD(1965) 3. 지식 기반 모티프 라이브러리 PROSITE(1988) 분자 분류 SCOP(1994) 생화학 경로 KEGG(1995) 온라인 간행물

- 전체 서열 데이터 게재하지 않고 데이터베이스 등록번호만을 게재 - 저자가 직접 공공 데이터베이스에 서열 투고해야 함 이전의 서열 나타내는 논문 현재 서열 나타내는 논문 Title ,,,,,,, Title ,,,,,,, ATGCGCATGGCC…….………………………….……………………………………………………………………………………………………… AF11596 서열 나타내는 논문 투고시 - 전체 서열 데이터 게재하지 않고 데이터베이스 등록번호만을 게재 - 저자가 직접 공공 데이터베이스에 서열 투고해야 함

동일 정보 공유 서열 데이터 투고 DDBJ DDBJ 국제적 협약 EMBL EMBL Database GenBank GenBank 장점 1) 신속하게 서열 데이터 보급 2) 정보의 중복성 없음

* 데이터 투고 * 데이터 투고의 공통 원칙 무엇을? 어디에? 한 군데에만 투고해야함 하루안에 등록번호 받을 수 있으며, 완성된 정보는 5~10일안에 사용가능 정보를 계속 갱신해야 함 월드와이드웹, 이메일, 우편(디스켓송부)등의 방법이 있음 * 데이터 투고의 공통 원칙 - 투고되는 정보는 충분한 기능해석 설명이 있어야 함 - 생물학적, 전산적으로 적절한 것 - 다른 과학자들에게 혜택이 돌아가는 것을 허용 - 단백질 데이터베이스, 관련문헌 데이터베이스, 유전체 데이터베이스에 링크 포함항목 : 염기서열, 단백질서열, 코딩영역, 유전자, mRNA 특징, 투고된 서열이 유래한 생물체, 인용 참고문헌, 실험적 상세한 설명 등

DNA/RNA 정확성, 신빙성이 중요 서열의 본질 : genomic DNA, mRNA, rRNA, cDNA 합성된 서열인가? : 합성분자 (단백질 발현 벡터서열과 같이 자연환경에서는 존재하지 않으나 실험적으로 합성된 서열  다른 분과에 등록해야 함 : 컴퓨터가 만든 서열 (consensus sequence)는 수용안됨 : DNA 데이터베이스의 모든서열은 서열분석으로부터 실험적으로 얻은 것임 : 잘개 쪼개서 서열분석 (Shotgun sequencing)한 결과는 됨 서열의 정확성 : 적어도 두번이상 (양방향)서열분석 된 것 : 가능한 한 이미 알려진 제한효소 지도로 점검해야 함

생물체 문헌 인용 서열이 밝혀진 생물체 (organism)를 꼭 밝혀야 함 - 단백질 translation이 달라지므로 매우 중요함 - 생물체 지정이 잘못될 경우 translation 할 경우 틀린 유전자암호가 사용되어 translation 된 단백질 산물의 서열이 틀리게 만들어 질 수 있음 - 종, 속을 정확히 기재 문헌 인용 연구 논문, 인용된 기초데이터들 사이에 적절한 연결이 필수적 데이터 투고 시에 임시 저자목록, 임지 제목을 만들어 인용 인용 문헌의 갱신

단백질 코딩 서열 염기서열 투고  염기가 coding하는 단백질 서열이 포함됨을 의미 - SWISS-PROT, PIR (단백질 데이터베이스) ; 대부분 DNA 데이터베이스 기록에 존재하는 단백질 서열들로 구성됨 - 단백질 서열이 필수적이지는 않음, 하지만 데이터 투고 과정에서 중요한 검증 절차 될 수 있음 효소의 서열일 경우  정확한 유전자 명명법을 사용해야 함 CDS (coding DNA sequence) - DNA 혹은 RNA와 단백질 서열을 연결 - CDS의 정확한 위치를 찾는 것  정확한 단백질 서열 확인 단백질을 직접 분석한 경우 (DNA 서열없이 투고)  SWISS-PROT mRNA Start codon Stop codon CDS

테이터 투고방법 1) 웹을 통한 방법 : 방법이 쉬우며 일반적으로 서열을 등록할 때 사용 - DDBJ ; Sakura 1) 웹을 통한 방법 : 방법이 쉬우며 일반적으로 서열을 등록할 때 사용 - DDBJ ; Sakura - EBI : WebIn - NCBI : BankIt 2) 프로그램을 이용한 방법 : multi-platform program으로 여러 서열을 동시에 등록하거나 복잡한 데이터 투고시 사용 - Sequin

BankIt 사용방법

스크롤바 아래로

염기서열 길이 입력

등록번호 ; 이 번호를 이용하여 정보 수정 가능함

몇 개의 서열을 투고할 것이지 설정

등록자 정보 및 연락처

서열을 등록할 연구자의 이름 등록

생물체 지정 (포맷에는 100개의 생물체가 있으며, 그 외의 것일 경우 따로 입력해야 함)

서열에 대한 정확한 정보 입력 서열이 유래한 샘플 서열의 종류 서열 입력

단백질의 세포 내 위치 (핵, 세포질)등의 다른 정보가 있을 경우 입력함 몇 개의 특징이 입력될 것인지 설정 한 개 이상의 CDS 첨가 할 수 있음 그 외 다른 정보도 입력 가능

Sequin 사용방법 서열기록을 새로 만들거나, 기존 기록을 갱신시키기 위하여 고안된 소프트웨어 컴퓨터 플랫폼에서 작업 가능 적합한 서열 : 고전적 염기서열, Segment 서열 , 긴 서열, 서열세트 등  좀 더 복잡한 데이터를 투고하는 경우에 매우 실용적 특징 1) 염기서열, 단백질 산물 서열, 유전코드 (생물체 이름)만 주어져도 CDS를 통한 interval을 계산해 주어 splicing site와 exon을 구분해 준다. 2) 단백질 서열의 특징을 입력 가능함 (Signal peptide, transmembrane region, cystein disulfide bond 등) 3) 유사서열 그룹을 등록할 경우, 서열 정렬에 대한 정보 투고를 허용함 4) 이미 수록된 Genbank 기록을 편집하고 재투고 할 수 있음 (정보 추가) 5) 파일 저장이 용이하고, 원하는 때에 최종적으로 데이터베이스에 보내면 된다.

Sequin 사용방법

파일을 다운로드 받을 수 있다.

임시제목 입력

교신자 정보

서열의 저자 및 소속 기관

서열 포맷 양식 : 투고되는 형태 설정 Alignment 형식 가능 Original Submission : 일반적인 투고 방법 Third Party Annotation : 실험적으로 증명된 내용을 첨부할때 이용

수정을 할 수 있는 편집기능 제공함. 수정 항목의 확인이 끝나면 입력된 데이터를 적절한 구조로 조립함

Sequin의 서열 기록 보기 – Genbank 포맷

Sequin의 서열 기록 보기 – 그래픽 보기

일반적인 DNA 데이터베이스에 투고할 수 없는 서열 sequences of less than 50 bp in length a genomic sequence of multiple exons joined together without the sequence of the intervening introns primer only sequences protein only sequences non-biologically contiguous sequences containing internal unsequenced spacers sequences containing a mix of genomic and mRNA sequence represented as a single sequence Expressed Sequence Tag (EST) submissions (should be submitted through the dbEST system) Genome Survey Sequence (GSS) submissions (should be submitted through the dbGSS system)