DNA Implementation of Version Space Learning

Slides:



Advertisements
Similar presentations
10-7 부동소수점 (Floating-Point) 계산  컴퓨터에서 숫자를 표기하는 방법  가수 (Fraction) : 부호화된 고정소수점 숫자 지수 (Exponent) : 소수점의 위치를 표시 ( 예 )10 진수 를 표기하면 Fraction Exponent.
Advertisements

Number Recognizer. Team 이성우 컴퓨터소프트웨어학과 조윤성 전자통신공학과
DNA Solution of the Hitting Set Problem 전기컴퓨터공학부 문승현, 김진.
주제 – 식물에 자외 선차단제를 바르면 어떻게 될까 ? 주제선정이유 우리는 자외선 차단제를 바르면 타지 않는데 식물은 어떤 반응을 나타낼까 궁금해서.
컴퓨터와 인터넷.
2016년도 제2차 서비스 자격시험 고사장 안내 시험종목: 병원서비스코디네이터, 서비스경영컨설턴트,
ㅎㅎ 구조체 구조체 사용하기 함수 매개변수로서의 구조체 구조체 포인터와 레퍼런스 구조체 배열.
색좌표 변환기의 설계 예 색좌표(Color Space) 색의 수학적인 표현 방법 RGB YIQ, YUV, YCbCr CMYK
Report #5 - due: 4/13 다음 10*5의 희소 행렬 A, B를 고려하라.
노인장기요양보험 ■제도의 의의와 발전과정 1. 고령이나 질병으로 거동이 불편하거나 혼자 생활하기 어려운 노인에게 신체활동 또
제 9 장 구조체와 공용체.
Learning Classifier using DNA Bagging
Windows Server 장. 사고를 대비한 데이터 백업.
윤성우의 열혈 C 프로그래밍 윤성우 저 열혈강의 C 프로그래밍 개정판 Chapter 12. 포인터의 이해.
Lesson 5. 레퍼런스 데이터형.
Number Recognizer.
디지털영상처리 및 실습 대구보건대학 방사선과.
제3장 스택과 큐.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
Error Detection and Correction
멀티미디어 시스템 (아날로그 이미지,신호를 디지털로 변환 방법) 이름 : 김대진 학번 :
Simulating Boolean Circuits on a DNA Computer
23장. 구조체와 사용자 정의 자료형 2.
2007 1학기 11 프로젝트 기초 실습.
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
CHAP 10:그래프 (2) 순천향대학교 하상호.
A Practice Device for Frequency Response
C 프로그래밍 C언어 (CSE2035) (Chap11. Derived types-enumerated, structure, and union) (1-1) Sungwook Kim Sogang University Seoul, Korea Tel:
Ⅲ-3. 생명의 연속성 5. 유전적 다양성과 현대의 진화
박성진 컴퓨터 프로그래밍 기초 [09] 배열 part 1 박성진
자료구조: CHAP 7 트리 –review 순천향대학교 컴퓨터공학과 하 상 호.
3장. 변수와 연산자 교안 : 전자정보통신 홈페이지 / 커뮤니티/ 학술세미나
Term Projects 다음에 주어진 2개중에서 한 개를 선택하여 문제를 해결하시오. 기한: 중간 보고서: 5/30 (5)
Chapter6 : JVM과 메모리 6.1 JVM의 구조와 메모리 모델 6.2 프로그램 실행과 메모리 6.3 객체생성과 메모리
3D 프린팅 프로그래밍 01 – 기본 명령어 강사: 김영준 목원대학교 겸임교수.
컴퓨터 저녁반 강의 안내 기본 소개 컴퓨터저녁기초반 교육과정 주차별 강의계획안 문의 : 과천시시설관리공단
Decision Tree & Ensemble methods
합집합과 교집합이란 무엇인가? 01 합집합 두 집합 A, B에 대하여 A에 속하거나 B에 속하는 모든 원소로 이루어진 집합을 A와 B의 합집합이라고 하며, 기호 A∪B로 나타낸다. A∪B ={x | x∈A 또는 x∈B}
돌연변이 생물교재론 양현주.
위치 에너지(2) 들어 올리기만 해도 에너지가 생겨. 탄성력에 의한 위치 에너지.
컴퓨터 프로그래밍 기초 - 8th : 함수와 변수 / 배열 -
5강. 배열 배열이란? 배열의 문법 변수와 같이 이해하는 배열의 메모리 구조의 이해 레퍼런스의 이해 다차원 배열
○ 직 무 기 술 서 드라이빙센터 매니저 1. 주요 업무 2. 자격요건 직 무 드라이빙센터 매니저 근무형태
객체기반 SW설계 팀활동지 4.
18강. 인터페이스 – II - 인터페이스와 다중상속 - 인터페이스를 통한 로봇 장남감 만들기 프로그래밍
끓는점을 이용한 물질의 분리 (1) 열 받으면 누가 먼저 나올까? 증류.
알고리즘 알고리즘이란 무엇인가?.
Version Space의 실험적 고찰 장해만.
에어 PHP 입문.
PCA 개선 서울대학교 박노열.
4장. 데이터 표현 방식의 이해. 4장. 데이터 표현 방식의 이해 4-1 컴퓨터의 데이터 표현 진법에 대한 이해 n 진수 표현 방식 : n개의 문자를 이용해서 데이터를 표현 그림 4-1.
DA :: 퀵 정렬 Quick Sort 퀵 정렬은 비교방식의 정렬 중 가장 빠른 정렬방법이다.
Word2Vec.
3. 반/전 가산기, 반/전 감산기 제작 컴퓨터 구조 실습 안내서.
Part 2 개념적 데이터 모델 Copyright © 2006 by Ehan Publishing Co. All rights reserved.
9 장 오류 검출 및 오류 정정 9.1 오류 종류 9.2 검출 9.3 오류 정정 9.4 요약.
공인인증로그인 매뉴얼.
수학 10-가 단계 Ⅰ수와 연산> 1.집합과 명제 > 1. 집합 > 3/9 집합 수업계획 수업활동.
Ⅳ. 제도의 기초 1. 물체를 나타내는 방법 3) 물체의 표현 방법 (2) 입체도법 지도학급 : 태화중학교 1학년 4반
공인인증로그인 매뉴얼.
Energy Band (고체속의 전자구조)에 대해서 쉬운 얘기를 한 후에 Bloch state 로 다시 돌아 가겠습니다.
제 4 장 Record.
어서와 C언어는 처음이지 제21장.
비축사업 전자계약시스템 도입 용역 사용자매뉴얼(업체담당자용) Version 1.0.
                              데이터베이스 설계 및 실습 #6 - SQL 실습 한국외국어대학교 DaPS 연구실                              
컴퓨터는 어떻게 덧셈, 뺄셈을 할까? 2011년 10월 5일 정동욱.
버스와 메모리 전송 버스 시스템 레지스터와 레지스터들 사이의 정보 전송을 위한 경로
교착 상태 해결 : 교착 상태 탐지 교착 상태 탐지(Deadlock Detection)
7 생성자 함수.
공인인증로그인 매뉴얼.
Presentation transcript:

DNA Implementation of Version Space Learning

Version Space Learning? Concept Learning 건물 내의 각 office를 돌아다니면서 recycling bin을 수거하는 로봇이 다음의 concept를 학습하고자 할 때… “An office that has recycling bins?” 주어진 concept를 다음에 주어진 attribute들을 이용하여 conjunction form으로 표현할 수 있다고 가정 Dept, {ee, cs} Status,{faculty, staff} Floor, {four, five}

예를 들어 5층에 있는 cs department의 faculty office  <cs, faculty, five> 4층에 있는 staff의 office  <?, staff, four> 그리고 주어지는 example 또한 위의 attribute들의 conjunction form으로 표현 된다. 이진 분류 : (+) or (-) Version space learning의 목적은 위와 같이 표현 가능한 concept 가운데 학습 데이터와 모순되지 않는 것을 찾아내는 것!  탐색문제

DNA Implementation 그러나 가능한 가설 공간의 크기는 exponential하므로 기존의 전자식 컴퓨터로는 실제 구현이 불가능 DNA 분자들을 이용하여 가설공간 전체를 표현하여, 초기의 전체 가설 공간에서 주어지는 example과 모순되는 가설들을 제거해 나간다. Concept 한 개  한 종류의 DNA 분자

cs faculty four <cs, faculty, four> cs ?status four <cs, ?status, four>

실험 과정 TUBE1  Initial Global Hypotheses Positive example? New Example TUBE2  All Hypotheses that classify the new example as positive TUBE1  TUBE1 ∩ TUBE2 TUBE1  TUBE1 - TUBE2 YES NO Repeat for every example

전체 가설 공간 생성 TUBE1(0) faculty four cs cs’ faculty’ four’ ee staff five ?dept ?dept’ ?status ?status’ ?floor ?floor’ Double strand에서 한쪽 single strand만 골라냄 TUBE1(0)

교집합 & 차집합(1) 교집합 현재 TUBE1에 들어있는 가설 가운데 각각의 attribute 값으로 Don’t care symbol을 갖거나, 입력으로 들어온 example의 attribute 값을 갖는 가설만 골라낸다. 예) <cs, faculty, four>의 경우 1.TUBE1 에서 ‘cs’나 ‘?dept’를 가진 것들만 취한다. 2. 1의 결과물에서 ‘faculty’나 ‘?status’를 가진 것들만 취한다. 3. 2의 결과물에서 ‘four’나 ‘?floor’를 가진 것들만 취한다. 이상의 과정에서 남은 결과물이 교집합의 결과이다.

교집합 & 차집합(2) 교집합 현재 TUBE1에 들어있는 가설 가운데 각각의 attribute 값으로, Don’t care symbol이나 입력으로 들어온 example의 attribute 값 이외의 값을 포함하고 있는 가설만 골라낸다. 예) <cs, faculty, four>의 경우 TUBE1에서 ‘faculty’ or ‘staff’ or ‘five’를 포함하고 있는 가설들만을 골라낸다.

교집합 & 차집합(3) 특징 장점 단점 실제로 TUBE2를 생성해 내지 않고 다만 BEAD를 이용하여 동일한 효과를 낸다. 매 example마다 consistent한 hypotheses들을 새로 만들 필요가 없다. Bead를 사용하여 각각의 attribute단위로 실험하므로 실험의 정확도를 높일 수 있다. 단점 교집합 연산에서 attribute 종류 수 만큼의 단계를 거쳐야 하므로 attribute의 종류가 많아질 경우 실험이 번거로워 진다.

교집합 & 차집합(4) 참고 A, B TUBE1 ee ?status, faculty TUBE1 ∩ TUBE2 ?floor, four ?dept, cs TUBE1 - TUBE2 staff five 차집합 연산을 수행할 때 교집합 연산에서 수행되고 남은 결과를 취하지 않고 다시 한번 나머지 attribute 값으로 걸러내는 이유는 실험의 정확도를 위함이다. A, B A나 B를 포함하고 있는 것 A와 B가운데 어느 것도 가지고 있지 않은 것 참고