DNA computing을 위한 염기서열에 대한 바람... 2003년 9월 16일 이지연
현재의 DNA computing 모델 문제 선택 분자 알고리즘 고안 정보를 전달하는 DNA 염기 서열 생성 생물학적 연산자를 사용하여 연산 수행 결과 해석
예를 들자면… 26 city TSP를 풀기 위하여… Initial pool generation을 위하여… 26개의 city sequences 8개의 cost sequences 위의 sequences를 바탕으로 한 96개의 road sequences 고안 Initial pool generation을 위하여… City sequences와 road sequences를 첨가하여 PCR without primers (complementary한 sequence끼리 hybridization하여 elongation)
현재의 MOEA Similarity H-measure GC ratio Continuity Hairpin Melting temperature Sequence의 set을 생성, 이후에 hybridization analysis를 통해서 좋은 set 선별
Sequences의 신뢰성& 적합성 신뢰성 적합성 눈으로 확인하기 어렵다 City sequences의 적합성 Cost sequences의 적합성
City sequences -모든 city를 포함해야 하니 같은 조건 ACATTCTGTCTCAGGCATCC 49.2722 54.8576 50 1 GATGGACTCTCAACCCCTGT 50.5723 56.201 55 2 AGGGATTCAGGGAAAGACCT 49.3016 56.4626 3 GAAGCCTGGGACAAGTTCAT 49.7428 56.5009 4 ACAGCATCATCTTGAGCCAG 49.9832 56.2103 5 CGTAACTCCCTCCGAAAAAG 48.4015 56.3728 6 GCACGGAAAGAATTTCTTGG 47.8004 57.1713 45 7 AATCTTTGAGGGTACAGGGC 49.0918 55.5895 8 GATCTACGATCATGAGAGCG 47.6952 53.1798 9 TCTGTACTGCTGACTCGAGT 49.8283 50.5817 10 CGAGTAGTCACACGATGAGA 48.7464 51.8059 11 ATGTACGTGAGATGCAGCAG 50.22 54.6311 12 TCAGAGATACTCACGTCACG 13 GCTGACATAGAGTGCGATAC 48.1457 50.677 14 ACATCGACACTACTACGCAC 49.699 50.9168 15 AAAGCACAAGAAGAGAGCAG 48.0907 52.4018 16 AGAAGGAAGCCAAGAACAGG 49.3604 55.9573 17 AATGGTGAAGAGGAAAGGGA 47.8036 55.9757 18 CTAACACCCAACTCACAACC 48.3883 52.7778 19 GGTGAGGTTGCATATTTGGG 48.8005 57.6143 20 CCACCCAACCAAACAAAACA 49.2319 58.9606 21 GAACGGAGAATGGAAAGTGG 48.5874 56.9134 22 GCTGCATTAGGACAACACAC 49.5942 53.9902 23 GTAATTCCGTGCGAATGACG 50.0422 58.8411 24 CTGCTAAGGTCACGGTCATC 50.2385 55.6016 25 GCTACTACTGAACACGACCT 48.8187 49.3123 49.08473846 54.66578077 49.6154 0.825365798 2.67074978 2.41788 -모든 city를 포함해야 하니 같은 조건 -균일해야 hybridization의 probability가 일정 -사실 hybridization은 절반 10 mer인데..
Cost sequences - 직선 or not… (deviation from the regression line) 1 TTTCTTTTCTGCTTTATTTGTTTTAA 46.0736 55.3048 19.23 2 CTCATTTGATTGTCTTGTTTCTTTAA 47.7061 55.9841 26.92 3 TTTCTTGTTGACTTCTTCTTTCTTCT 49.7558 56.3331 30.76 4 TTAGACTAGTGTCCTCATGTTTGTTT 50.7682 55.4661 34.61 5 TCTTCTCAACTATTACCGTTCCTTTC 51.2665 58.3076 38.46 7 AACCATAGACACCCAAGTCGACCCAT 57.6876 66.3773 50 8 TGTCGTGATGCTGAGAGTGTGAGGTG 58.7305 67.6221 53.84 11 GGGAGGTGGCCTGTTCTCGTCGGAGG 63.8812 75.2685 69.23 - 직선 or not… (deviation from the regression line)
예를 들어본 실험 결과들 Initial pool generation 방법과 같은 DNA strand 형성 실험 Many not-expected products 아마도 non-specific hybridization의 결과? 예상 크기 5 city 4 roads 204 mer 7 city 5 roads 296 mer 8 city 7 roads 342 mer 9 city 8 roads 388 mer 10 city 9 roads 434 mer
결과 하나 5 city 7 city 8 city 9 city 1 kbp 100 bp 간격 400 bp 300 bp 50 bp 388 mer 342 mer 296 mer 204 mer 50 bp 간격 50 bp
결과 두울 10 city 1 kbp 100 bp 간격 400 bp 300 bp 434 mer 50 bp 간격 50 bp
결과 셋 7 city 8 city 9 city 10 city 1 kbp 100 bp 간격 400 bp 300 bp 50 bp 434 mer 300 bp 388 mer 342 mer 296 mer 50 bp 간격 50 bp
그러니까, 얘기하고 싶은 것은… 예상되어지는 크기의 band나, 그보다 작은 bands가 나와야 하는데… 예상되어지는 band 외의 잡band들이, 생각보다 너무 많이 존재 (일반적인 PCR과는 다르게 primer가 없어서, internal sequence의 homology가 중요하게 작용?) 한두 개의 oligomer들간의 interaction에는 문제가 없을 수 있지만, 많은 oligomer들이 섞여 있을 때에 예상하지 않은 결과들 관찰 Hybridization/ligation을 하는 경우에는 거의 없던 문제 Annealing 온도가 55℃로 꽤 높은데도 불구하고, 다른 산물들 존재 가운데 있는 cost sequence의 영향도 있지만, sequence의 신뢰도가 많이 떨어지는 게 아닐까…
어떻게 할 수 있을까? 정말 좋은 sequence를 만든다 안좋은 sequence를 견뎌낼 수 있는 tolerable protocol을 만든다 둘 다 가능한 이야기인지?