3.2 구조 및 기능 예측 part 1 (Prediction of Structures and Functions) 2006.5.1 정용진
열역학적 원리 서열 구조 native state unfold state 서열 구조 native state unfold state Christian Anfinsen - ribonuclease : denaturation-renaturation 구조/기능 예측 - 순수 계산적 예측 : 아미노산 서열 3차원 구조예측 : 문제 : 에너지 함수의 정의 & 지역적 최소값 온도, 압력, 용매조건
열역학적 원리 구조 에너지 함수 경험적 서열-구조 관계 :지식기반의 3차 구조예측 E= Eb + Eθ + EΦ + Evdw + Eel 알려진 고유 구조에서 3차원 구조의 변화를 예측하는데 유용 (단백질 공학에 사용) 경험적 서열-구조 관계 :지식기반의 3차 구조예측 X-ray crystallography NMR (nuclear magnetic resonance)
RNA 2차 구조의 예측 순수 계산 예측 - 줄기들과 서로 다른 루프들에 의한 에너지 함수의 극소화가 포함 - 줄기 (유사성점수) & 루프 (공백벌점) 를 이용하는 서열정열 문제로 동적 프로그래밍을 사용하여 최적의 RNA 2차 구조 예측 조합적 최적화 문제 (combinatorial optimization problem) 모든 가능한 줄기를 나열, 주어진 에너진 함수에서 겹치지 않는 줄기들을 갖는 최적의 조합을 탐색 Hopfiled neural network
홉필드 신경망(Hopfield neural network) RNA 2차 구조 예측 - 조합적 최적화 문제 해결 위한 방법 인공 신경망 (Artificial neural network) - 생물학적 신경망과 인간 뇌의 처리능력을 모델 로 한 계산 패러다임 - 홉필드 신경망 : 대칭적으로 연결된 네트워크 : 에너지 함수의 최소화 - 확률적 과정에 의하여 가능
단백질 2차 구조 예측 RNA 2차 구조 예측 : 서열 정렬의 문제 (상보 염기쌍) 단백질 2차 구조 - 서열 특징 (-) - α-helix & β-sheet : 계산적 예측 (통계역학2차 구조 형태 분석) 경험적 방법 초우-파스만 (chou-Fasman) 방법 당시 3차원 구조가 알려진 15개 단백질들에 대한 통계적 분석에 기반 알려진 단백질 구조에서 각각의 아미노산이 나선, 평면, 그리고 턴을 형성하는 통계적 경향성 분석에 기초 GOR (Garnier-Osguthorpe-Robson) 방법 :자동화 방법
막투과 단편 예측 (Prediction of transmembrane segments) 막단백질(Membrane protein) -helix (세포막) 막단백질에 대한 일반적인 구조적 모티프 : 3nm/0.15nm 20 hydrophobic a.a. residues Klein-Kanehisa-Delisi, KDD 판별식 분석(Discriminant analysis) 17개 잔기들의 단편에 대한 소수성 평균을 변수로 사용, 알려진 단백질의 학습데이터로부터 판별함수 정의 90% 이상의 예측 정확도
계층적 신경망 (Hierarchical neural network) Perceptron - synapse를 수학적으로 모델링한 신경망의 초기 형태 - 1950’ by F. Rosenblatt - 입력층 출력층 (판별의 가중치: 선형조합에 근거) - 단점: 선형적으로 분리 가능하지 않은 문제 역전파 신경망 (Back-propagation neural network) - 다층 퍼셉트론 - 입력층, 중간(은닉)층, 출력층 - 연결강도를 조정하기 위해 반복적 학습방법 사용