Additional fitness measures for Sequence Generation 2001.12.21 신수용
(C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/ Assumptions 같은 성질을 가지는 sequences들만 한번에 만든다. Ex 1) vertex sequences, weight sequences, hairpin Ex 2) 서로 길이가 다른 sequences, Tm이 다른 sequences.. 이 모든 것은 Data Manager에서 handling한다. (C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/
(C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/ General (I) Generate new sequences. Add sequences to the existing pool. Add sequence manually. (C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/
(C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/ General (II) Make normal sequences. Make hairpins. Make weight sequences. Number of sequences. Length of each sequences. (C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/
(C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/ Fitness terms Avoid mis-hybridization Similarity H-measure 3’-end Prevent the undesired secondary structures Hairpin (self-complementary) Continuity Keep uniform chemical characteristics GC-contents Tm (C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/
(C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/ GA options Maximum generation Maximum population Crossover rate Mutation rate Termination condition Selection strategy Elitism Decide the weight values (C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/
(C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/ Necessary measures PCR primer testing 조사 필요 Continuity 검사시 purine과 phyrimidine 구분 Restriction enzyme 추가 Decide the sequence partially. Restrict the bases or add new bases. Tm 계산 parameter 추가 GC%를 range로 결정 (C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/
(C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/ Necessary measures No GGG No Fraying Check the sequence should begin and end with a G or C No AUG No GUG No UUG Start codon. (C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/
(C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/ Necessary routines Test the property of sequences. Generate complement sequences Hairpin 생성 및 유지 루틴 필요 (for GA) Multi-objective optimization으로 변경 Multi-population GA.. Fitness term normalize (C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/
Making Lab experiments Simulation Part
(C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/ Simulation Parts Basic Assumption Tube를 3차원 좌표공간으로 생각한다. Sequence들은 tube로 구성된 좌표공간의 점으로 존재한다. Sequence들은 tube에서 uniform하게 존재한다. Sequence들의 행동은 Brownian motion으로 결정된다. Differential equation등을 사용하지 않고, sequence 하나하나의 행동을 trace하면서 변화과정을 결정한다. 가능한 세부적인 model을 결정하고, 작은 model들을 결합하여 하나의 실험 과정을 simulation한다. (C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/
(C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/ Assumptions II Tube 좌표공간에서 sequence들은 random하게 분포한다. 농도는 좌표공간의 점의 개수로 조절한다. 실험 방법에 따라 선택되는 sequence의 수가 결정되고, 각 sequence들은 random하게 선택된다. Parameter들에 의해서 확률적으로 선택할 수도. 각종 enzyme 및 실험 환경 고려 필요! (C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/
(C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/ 예상 modules Hybridization Polymerization Ligation Melting Gel electrophoresis or PAGE TGGE (C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/
(C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/ Hybridization 2개의 기본 model로 구성된다. Sequence간의 충돌 model 브라운 운동식을 이용하여 sequence간의 충돌 가능성을 계산 Sequence간의 결합 model NN model을 이용하여 Tm을 계산한 후 tube의 온도와 비교하여 결합 여부 결정 확률적으로 결합 (Tm curve 참조) (C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/
(C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/ PCR Hybridization, Polymerization, Melting 3가지 module의 결합으로 구현된다. (C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/
(C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/ Gel 길이 및 온도 등에 의해 split한다. 이 부분은 정확도를 위해 deterministic하게 결정한다. 실제 실험에서 사용되는 gel 사진과 같이 Graphical representation을 만든다. (C) 2001, SNU Biointelligence Lab, http://bi.snu.ac.kr/