Chap. 1 Molecular and Biological Chemistry
BIOINFORMATICS ? BT(Bio Technology) + IT(Information Technology) Evolution Developmental Biology Transcriptomics Phylogenetics Bioinformatics Genetics System Biology Proteomics Molecular Biology
Bioinformatics = information technoligyu applied to the management and analysis of biological data 여러 학자들에 의한 정의 Computer science에 의해 생물학적 정보를 저장하고 다루는 학문으로 모든 생물 학 연구를 위한 기반을 제공한다. 2) 각각의 생물체에서, 그리고 나아가서는 생태학적인 관점에서 유전자와 단백질, 전 체 유전체 등의 모든 종류의 생물정보를 컴퓨터에 의해 다루는 분야이다. 3) Biological, biochemical, biophysical 데이터들을 분석하기 위하여 수학, 통계학, 컴퓨터 기술 등이 융합된 학문. 이러한 데이터들, 예를 들면 염기서열, 단백질서 열, 구조, 기능, 경로, 유전적 상호작용 등의 데이터의 저장, 검색, 분석하는 방법 들을 포함한다. 4) 생명과학에 있어서의 정보에 대한 문제들을 컴퓨터에 의해 해결하는 것이다. 주로 유전자, 단백질, 유전체의 방대한 데이터베이스를 다루며, biological system에서 biomolecule들의 three-dimensional modeling을 포함하기도 한다.
Structure of DNA Meaning of DNA Figure 2.14 American James Watson (left) and Englishman Francis Crick and are shown with the 3-dimensional model of DNA they devised while working at the University of Cambridge in England. Meaning of DNA https://www.youtube.com/watch?v=uXdzuz5Q-hs
A always pairs with T (see part b) G always pairs with C (see part b) Each nucleotide is composed of a phosphate, a sugar, and a nitrogenous base Nitrogenous bases Sugar (S) Purines Pyrimidines A always pairs with T (see part b) Adenine (A) Thymine (T) Deoxyribose Phosphate (P) G always pairs with C (see part b) Figure 2.13 DNA structure. (c) A phosphate, a sugar, and a nitrogenous base comprise the structure of a nucleotide. Adenine and guanine are purines, which have a doublering structure; cytosine and thymine are pyrimidines, which have a single-ring structure. Guanine (G) Cytosine (C)
Nucleotides
Double-helix Pauling의 triple DNA helix model의 시도 실패함
Each strand is a chain of of antiparallel nucleotides. DNA double helix is made of two strands. Each strand is a chain of of antiparallel nucleotides. “Rung” Sugar-phosphate “handrail” Sugar-phosphate “handrail” Nucleotide “Handrails” made of sugars and phosphates Figure 2.13 DNA structure. (a) DNA is a double-helical structure composed of sugars, phosphates, and nitrogenous bases. (b) Each strand of the helix is composed of repeating units of sugars and phosphates, making the sugar-phosphate backbone, and of nitrogenous bases. Nucleotides within strand are connected by covalent bonds. The two strands are connected by hydrogen bonds between the nucleotides. “Rungs” made of nitrogenous bases https://www.youtube.com/watch?v=ZGHkHMoyC5I
Packing
A SEM picture of human chromosome
Mid-phase Inter-phase FISH (florescence in situ hybridization) for Amborella trichopoda Mid-phase Inter-phase Blue: nuclear genome Red: mitochondria genome Green: chloroplast genome Amborella 세포 핵에서의 세 유전체의 분포를 FISH에 의해 보여준 사진. FISH는 특정 DNA 조각의 끝에 florescence dye를 labeling 한 후 이를 probe로 사용하여 genome에 hybridization 시킴으로서 이 DNA염기서열과 같은 염기서열이 genome 상에 어디에 위치하는지를 밝힐 수 있는 기술이다. 위의 사진에서 핵DNA 구간을 probe로 사용하면(파란색) 세포분열 중기에서는 핵유전체들이 뭉쳐서 염색체를 형성함으로 파란색이 염색체 수 만큼 보이게 되지만 간기에서는 파란색이 흩어져 보여 유전체가 뭉쳐져 있지 않음을 알 수 있다. 초록색과 빨간색으로 표지된 엽록체 및 미토콘드리아 유전체는 중기와 간기에서 변화가 없음을 알 수 있다.
DNA polymerization Unzip first! DNA polymerization: DNA polymerase extends a primer by using a complementary strand as a template. Unzip first! 5) Mg++ 3) DNA POLYMERASE G T C A 2) PRIMER 3’ 5’ A C T G 1) TEMPLETE 3’ 5’ … G C A T 4) dNTP’s pool G C A T dATP dCTP dGTP dTTP G T C A 3’ 5’ … Newly synthesised strand
DNA replication
Animation: DNA replication
Central Dogma Reverse-transcription Central dogma는 생명체 내에서의 기본적인 정보의 흐름을 말한다. 즉 모든 정보는 DNA 상태로 코딩되어 있으며 mRNA로 전사되어 protein으로 번역된다는 것이다. Protein은 생명체의 기본 구조를 형성 할 뿐 아니라 생명현상의 가장 기본적인 활동을 매개하는 모든 종류의 enzyme을 이루는 기본 구성물이다. RNA virus는 유전정보를 RNA 상태로 코딩하고 있어서 이의 발견은 central dogma에 어긋나는 현상이라고 생각될 수도 있지만 RNA는 DNA로 reverse-transcription(역전사)이 일어나 DNA를 만든 후 central dogma의 기본 흐름을 이어가게 된다. 그러므로 RNA virus의 존재 또한 central dogma에 위배되는 것은 아니다. Reverse-transcriptase의 발견에 의해 불안정한 상태의 mRNA를 안정된 상태의 cDNA로 바꿀 수 있어 이는 mRNA 연구 및 유전체 연구의 혁신적인 방법이 되고 있다.
생각해 봅시다! 식물분자계통학실에서는 Magnolia kobus (목련)에 대한 전체 유전체 결정 프로젝트를 진행 중에 있다. 현재 ver. 0.4의 assembly가 진행되었고, 어떤 유전자들이 포함되어 있는지에 대한 기초 분석을 수행하였다. 그 결과 가장 많은 수 (multiple copy)를 갖는 유전자들은 reverse transcriptase 였다. 과연 어떤 일이 일어난 것일까???
Transcription and Translation P-site A-site Transcription animation Translation animation
tRNA structure tRNA structure를 가장 먼저 밝혀낸 한국 학자: 김성호박사(UC Berkley) http://www.dongascience.com/news/view/6494
18S rRNA structure Assembly of rRNA into the ribosomal subunits in insects.
Ribosome mRNA rRNA tRNA In prokaryotes, Large subunit = 23S rRNA + 5S rRNA + proteins Small subunit = 16S rRNA + proteins
Codon table Q: 왜 codon은 triple codon 일까?
Genetic code Codon: triple base pair가 각각의 amino acid를 지정한다. 왜 genetic code 는 triple 일까? double code는 42 = 16 개의 서로 정보를 저장한다. triple code: 43 = 64 (20 개의 amino acid들의 정보를 담기에 너무 많다!!) 그러므로 triple code에서는 하나의 amino acid에 중복된 code들이 존재한다. Degenerate site (축쇄 좌위) - twofold degenerate site - fourfold degenerate site Synonymous codon: code가 변해도 해당 amino acid는 변하지 않는 것. Nonsynonymous codon: code가 변하면 amino acid도 변하는 것. Initiation codon: AUG Stop codon: UAA UAG UGA
친핵성 소수성 방향성 산성 염기성
In chemistry, polarity refers to a separation of electric charge leading to a molecule or its chemical groups having an electric dipole or multipole moment. H2O
Protein structure Protein structure animation https://www.youtube.com/watch?v=REsNa7Bt_E4 Fold it-protein folding game Nate news about “Fold it” http://www.seehint.com/r.asp?no=12910
Splicing Splicing animation Introns: protein 합성 과정 중에 mRNA의 일부가 잘려나가서 정보가 쓰이지 않는 DNA 부위 - 거의 항상 intron은 “GT-----AG” 의 구조 로 이루어져 있다(GT-AG rule). Exons: protein 의 정보를 포함하는 DNA 부위 Intron의 크기와 구조는 유전자에 따라 매우 틀림 histon: intron 이 없음 virus SV40: 31bp human dystrophin gene: 210,000bp Splicing animation
Alternative splicing Alternative splicing: 하나의 염기서열이 여러 기능을 하는 다양한 단백질을 만들어 내는 역할을 함.
Kim et al., 2005. Sequence and expression studies of A-, B-, and E-CLASS MADS-box homologues in Eupomatia (Eupomatiaceae): support for the bracteate origin of the calyptra. International Journal of Plant Sciences 166: 185-198. 웹사이트의 저널1 확인 하시오.
mRNA Processing 5’ capping Splicing 3’ tailing