개 념 개요 지능을 가진 객체의 특징 컴퓨터에게 지능 부여 학습의 일반적 정의 새로운 환경에 적응

Slides:



Advertisements
Similar presentations
김수연 Capstone Design Realization Cost Reduction through Deep Artificial Neural Network Analysis.
Advertisements

내 마음의 버 스 이천신하교회 청년부. 이름 : 한상훈 나이 : 30 살 종교 : 기독교 ( 모태신앙 ) 생활신조 : 인생은 한방 ! 로또나 사자 이상형 : 청순 가련한 모태미녀 특이사항 : 걸그룹 노래에 환장함 식스팩을 갖기엔 슬픈 몸을 타고 남.
독서골든벨 2009 학년도 6 학년 1 학기 6-10 반. 1. 이야기 삼국유사 정대한 원효대사는 수행을 위해 떠나던 중 피곤하여 숲 속에서 잠이 들었다. 잠결에 너무 목이 마른 나머지 어디에 담겨있는 물을 맛있게 마셨나요 ?
인공지능 소개 부산대학교 인공지능연구실. 인공 + 지능 인공지능이란 ? 2.
2013 년 목 차 용어의 정의 위기경보 수준 국가 생물테러 대응 체계도 반 · 팀별 소방의 임무.
폭력. 폭력이란 무엇인가 우상의 눈물 물리적인 폭력 ( 최기표 ) VS 지능적인 폭력 ( 임형우, 담임선생님 )
2015 Product design 산업디자인과 Kim Dong Hyun.
두 손 들고 두 손 들고 찬양합니다 두 손 들고 찬양합니다 다시 오실 왕 여호와께 다시 오실 왕 여호와께 두 손 들고 찬양합니다 두 손 들고 찬양합니다 다시 오실 왕 여호와께 다시 오실 왕 여호와께 오직 주만이 나를 다스리네 오직 주만이 나를 다스리네 나 주님만을.
Structure of Supply and Value Chain - 항공기 부품 정밀 가공 주 ) 정진기계 한화 자재 사급 정진기계 가공 한화에 납품에어 프랑스 보잉 군납 당사는 정밀 가공을 핵심 기술로 하는 업체로 대기업인 한화로부터 자재를 받아 정밀 가공을 한.
데이터 마이닝 연구실 윤언근. □ 결정트리 □ 연관규칙 □ K-Means 알고리즘 □ 유전자 학습 □ 데이터 마이닝 기법의 선택.
1 박 2 일 !!! 인천마장초등학교 유수아. 1 박 2 일 멤버 인기순 위 1 위 이승기 2 위 엄태웅 3 위 은지원 4 위 김종민, 이수근 ※인터넷에서 본것이기 때문에 사람에따라 서 다를 수 있다. ※
제2장 생명공학의 발달사.
지금은 기도 하는 시간입니다 1. 송구영신예배를 위해서 2. ‘크리스마스 이브’ 행사를 준비하는 교육 기관을 위하여
석관중앙교회 5남전도회 석 관 중 앙 교 회 회원 소식 통권 05-04호 발행일 : 2005년 04월 회 장 : 장진호 집사
1. 던전 디자인 개요_1 1. ‘던전’ 룬스톤은 던전 한 층에도 여러 개가 존재하며, 각 룬스톤 마다 영향을 미치는 범위가 설정되어 있다. 룬스톤이 영향을 주는 범위에 일정시간 사용자가 위치해 있게 되면 사용자 캐릭터는 ‘유령화’ 되어 버리기 때문에, 사용자는.
지역사회복지론 1조. 요양보호시설에 대해서 황성국 임재형 이동영
Chapter 2 정보시스템 아키텍처 (IS Architecture)
현대사회의 여성문제와 여성복지 3조 권경욱 강향원 황대인 변갑수 박창욱 김지현.
우리아이의 미래를 행복하게 만듭니다.
한우TMR 사용의 문제점과 개선방안 제일사료㈜ 김 덕 영.
I 문학의 개념과 역할 1. 문학의 개념 (1) 언어 예술로서의 문학 (2) 소통 활동으로서의 문학
고교평준화의 득과 실 김영주 이지영 최윤영.
4. 목적론적 윤리와 의무론적 윤리 01. 경험주의와 이성주의 01. 경험주의와 이성주의 02. 결과론적 윤리와 공리주의
정 의 학습의 일반적 정의 기계학습(Machine Learning)의 정의
18장 자연선택과 적응.
데이터마이닝의 소개 Data Mining Introduction
12. 데이터베이스 설계.
Numerical Analysis - preliminaries -
8장. 가시성 판단 학습목표 후면제거의 정의와 처리방법을 이해한다. 절단작업의 정의와 처리방법을 이해한다.
Genetic Algorithm 신희성.
Technological Forecasting & social change(2014)
제 3 장 신경회로망 (Neural Networks)
9. 기계학습.
Cluster Analysis (군집 분석)
5. 비제약 최적설계의 수치해법 (Numerical Methods for Unconstrained Optimum Design)
7. 자극과 반응 7-2. 신경계 3. 여러 가지 반응.
머신 러닝 2 ㈜ 퀀트랩.
2010년 직원연수 자료 제1차 : 4월 16일 ~ 17일 제2차 : 4월 23일 ~ 24일
Parallel software Lab. 박 창 규
『디지털 기업을 위한 경영정보시스템』 홍일유 著 ⓒ 2005 Ilyoo B. Hong. All Rights Reserved
Ⅲ-3. 생명의 연속성 5. 유전적 다양성과 현대의 진화
Genetic Programmed Soccer Softbot
개항기 조선과 동아시아 박 범 한국역사입문Ⅱ.
정 책 결 정 론 제8장 의사결정론 정책결정론.
정보 추출기술 (Data Mining Techniques ) : An Overview
연구를 위한 준비 참고문헌 카드 만들기.
6장 데이터 타입(3) 순천향대학교 컴퓨터공학부 하 상 호.
Ch01. 지능형 시스템 개론.
돌연변이 생물교재론 양현주.
대구의 부도심 대구의 주요축 동대구 부도심 4조 강민석 / 박성균 / 최은지/ 황재현/김예지.
정보처리학회논문지 B 제10-B권 제1호(2003.2) 김만선, 이상용
뉴미디어 이용과 뇌 구조의 변화 <생각하지 않는 사람들>
제5장 진화와 생물다양성 생명의 기원 원시지구에서 생명이 어떻게 출현했을까?
- 과거 500년의 조선과 동아시아 정세를 중심으로 -
사도행전 13장 22절 말씀 –아멘 다 윗 을 왕 으 로 세 우 시 고 증 언 하 여 이 르 시 되 내 가 이 새 의 아 들
다윈은 약육강식을 말하지 않았다 (거꾸로 생각해 봐! 2. 세상도 나도 바뀔 수 있어)
제 4 장 유전자 알고리즘 (Genetic Algorithm)
현대 진화 생물학의 주요개념 (Key Concepts of Modern Evolutionary Biology)
직장생활 예절 ① - 인사 1.내가 먼저 [인사의 5point] 2.상대방의 눈을 보고 미소지으며 3.상대방에 맞춰서
경찰행정과 세미나 결과를 공개해야한다. VS 비공개로 해야한다. 경찰의 근무성적평정 제도.
▶서류관리 프로그램 1. 로그인….2 2. 서류등록 … 서류도착 서류스티커발행
교육훈련 기획 및 운영실무 교육훈련 기획 및 운영실무 교육훈련 기획 및 운영실무.
색채의 공감각 맛 음 냄새 촉감 5. 모양.
G20 Summit 관련 공항이용 안내 공지 에어칼린 한국총판대리점 감사합니다. 항공보안등급 상향일정
나-는 믿음으로 주 얼굴 보리니- 아침에 깰 때에 주형상에 만족하리 나주님 닮기 원하네 믿음으로 주얼굴 보리라 -
개 념 개요 지능을 가진 객체의 특징 컴퓨터에게 지능 부여 학습의 일반적 정의 새로운 환경에 적응
사랑의 빛, 나눔의 별 Rain maker Samsung 숙명여자대학교 언론정보학부 조 혜 진.
CSI 진화연산 2008년도 제 1학기.
Ray Casting 발표자 : 박 경 와
Model representation Linear regression with one variable
Presentation transcript:

개 념 개요 지능을 가진 객체의 특징 컴퓨터에게 지능 부여 학습의 일반적 정의 새로운 환경에 적응 개 념 개요 지능을 가진 객체의 특징 새로운 환경에 적응 새로운 문제를 풀 수 있는 능력 컴퓨터에게 지능 부여 지능을 가진 컴퓨터 프로그램이 가능한가? (많은 학자들이 부정적) 주어진 입력을 컴퓨터 성능을 점차적으로 개선하는 방향으로 해석하도록 하는 방법 제공 학습의 일반적 정의 주어진 환경 내에서 반복되는 경험으로 인해서 발생되는 어떤 주체의 행동 변화 일시적인 주체의 상태(피로, 약물복용 상태)로는 설명 불가 → 컴퓨터 분야를 위한 정의로는 부적절 문제 풀이 : 광역적인 의미에서 보면 모든 인공지능 프로그램들이 문제풀이 시스템이라고 할 수 있다 계획 - 일반적으로 계획이라고 하는 것은 행동을 취하기 전에 행동들의 순서를 결정하는 것

기계학습(Machine Learning)의 정의 학습 프로그램과 일반 프로그램과 구별하여 특징지우는 방법 필요 그렇게 만족할 만한 정의가 내려지지 못하고 있음 정의가 어려운 이유 1) 새로운 지식의 습득 컴퓨터의 데이터 습득은 용이 ↔ 사람은 어려움 데이터의 습득은 진정한 학습 프로그램이 아님 2) 문제 풀이 지식 표현 추론 일반적인 작업을 처리하는 프로그램과 유사 → 굳이 정의하자면, 새로운 지식을 습득하면서(1) 새로운 상황의 문제를 풀 수 있는(2) 프로그램.

기계 학습 시스템 모델 Simon의 단순 모델 원: 선언적 정보 사각형: 절차 화살표: 자료의 흐름 원: 선언적 정보 사각형: 절차 화살표: 자료의 흐름 주위환경: 학습요소에 특정 정보 제공 학습요소: 입수된 정보로 지식베이스 개선 실행요소: 지식베이스의 지식 이용, 특정의 작업 수행 네가지 구성요소의 구현 방식에 따라 학습 시스템 분류 → 주위환경, 지식베이스, 실행 작업들이 학습문제의 본질을 결정 → 학습 요소가 수행해야 할 특정 기능 결정 학습 요소 (Learning Element) 실행 요소 (Performance Element) 주위 환경 (Environment) 지식베이스

학습 전략에 의한 기계 학습의 분류 학습 전략: 어떻게 학습하는가? ↔ 얼마나 추론을 많이 하는가? 학습 전략: 어떻게 학습하는가? ↔ 얼마나 추론을 많이 하는가? 1) 지식 증대, 직접 프로그램된 시스템 → 추론 없음 → 프로그래머의 책임이 크다 2) 새로운 이론 발견, 새로운 개념 도출 → 풍부한 추론 수행해야 가능 3) 중간 정도의 추론 수학 책의 예제 풀이(교사의 풀이를 학습, 교사의 풀이를 유추) 교사의 지도가 없는 풀이, 새로운 이론 발견보다는 추론이 훨씬 적다. 추론의 양 vs 교사, 외부환경의 부담 추론의 양 증대 → 교사의 지도 부담이 줄어든다. 어떤 작업의 지도 유사한 작업을 다루는 방법을 보여줌 → 교사는 쉽게 지도, 학습자는 많은 생각(추론)을 해야 함 그 작업을 단계별로 설명하여 가르침 → 교사는 지도에 많은 노력 필요, 학습자는 간단히 단계를 실행(적은 추론)

학습의 분류 암기 학습(Rote Learning): 지식의 직접적 부여 학습자 측면에서 추론이나 지식의 변형이 불필요 학습이 외부 객체에 의해 미리 프로그램 됨 주어진 사실, 데이터에 대한 기억만 저장 → 입력에 대한 추론 없음 지도에 의한 학습(Learning by Advice-taking) 교사, 교과서 같은 지식 원천으로부터 지식 습득 교사는 학습자의 지식을 증대하기 위해 지식을 잘 조직해야 함 → 부담 전문가 시스템의 구축과정과 동일 유추에 의한 학습(Learning by Analogy) 이미 존재하는 지식을 변형하거나 증식하여 새로운 사실, 기술 습득 예) 자동차 운전 기술을 이용, 트럭 운전이 가능(운전 기술의 변형 필요) 지도에 의한 학습보다 많은 추론 요구: 유사성에 대한 검색, 새로운 상황에 적용

예를 통한 학습(Learning from Examples) 어떤 개념 묘사를 위해 긍정 예(positive example): 개념을 잘 설명하는 예 부정 예(negative example, counterexample): 개념을 부정하는 예 부정적인 예들의 성질을 배제하면서 긍정적인 예들의 성질을 묘사 → 주어진 개념에 대한 일반적인 개념 묘사 추론 → 지도, 유추에 의한 학습보다 추론 양이 많다.(교사는 예제만 제공) 귀납적 학습의 특수한 경우 예가 주어지는 방법 교사가 예를 제공: 목표 개념 형성이 유익한 예를 선별 제공 학습자가 예를 생성: 목표 개념이 무엇인지 불분명할 때 → 분류 경쟁하는 개념들을 식별하는 정보에 기초하여 스스로 예를 생성 교사의 긍정, 부정에 대한 지도 필요 예) 강자성체 → 모든 금속 → 동전 실험 →모든 금속이라는 성질 배제 외부환경에서 예 제공: 예제 생성과정 무작위 → 통제없는 관찰에 의존 예) 초신성 전조 → 개념은 있지만 → 언제, 어디서 초신성 발생할 지 모름

일괄 학습(batch learning) vs 점진 학습(incremental learning) 학습자의 예제 이용 형태 긍정적인 예제만 이용 습득해야 할 개념에 대한 좋은 예시 제공 과도하게 일반화되는 것은 막을 정보 제공이 불가능 → 최소의 일반화 고려, 추론되는 개념에 제약을 가하는 영역지식에 의존 긍정적, 부정적 예제들을 모두 사용 긍정적인 예제들의 개념을 일반화 시킴 부정적인 예제들은 과도한 일반화를 막는다. 예를 통한 학습의 가장 근본적인 형태 일괄 학습(batch learning) vs 점진 학습(incremental learning) 일괄 학습: 개념 형성에 필요한 모든 예제들을 한번에 모두 제공 무분별한 예제가 주어질 확률이 줄어든다. 점진 학습: 이용 가능한 자료들을 이용, 하나 이상의 개념 가설 형성 → 점차적으로 추가적으로 주어지는 예제들을 이용, 가설 개선 인간의 개념 학습 방법과 유사 여러 개의 개념 습득에 유용

관찰을 통한 학습(Learning from Observation) 귀납적 학습의 가장 일반적인 형태 비지도 학습(unsupervised learning)으로도 분류됨 발견시스템, 이론 형성 작업, 분류 계층 형성을 위한 분류 기준 생성, 외부 교사 부재의 학습 → 다른 어떤 학습보다도 더 많은 추론 요구 개념을 위한 적당량의 예제도 주어지지 않음 예제들의 긍정, 부정에 대한 정보도 없음 한 개념에 초점을 맞추지 않음 → 때에 따라서 습득될 필요가 있는 여러 가지 개념에 대해서 동시에 고려 → 개념 초점 맞추기 문제 발생 외부 환경과의 상호작용 관점 수동적 관찰: 주위환경의 여러 양면들을 (단순) 관찰, 분류 능동적 관찰: 주위환경을 변동(실험)시키고 그 변동 결과를 관찰 무작위의 실험 다양한 가설 상황에 따라서 필요한 예제 생성

암기 학습(Rote Learning) 기억: 필요할 때를 위해 새로운 지식을 저장 검색이 주요 동작: 계산이나 추론이 아님 기억의 중요성 기억이 분리된 학습과정은 의미가 없다 기억이 인식 시스템에서 매우 중요한 주체 → 가장 기초적인 학습과정 실행 요소가 해결한 문제를 받아서 그 문제와 해답을 기억 자료 감축(data reduction)의 개념: Lenat, Hayes-Roth, Klahr ACCESS CALCULATE DEDUCE INDUCE 캐슁(암기) 알고리즘, 이론 휴리스틱 규칙 2차 방정식을 풀 때 연역 사슬에서 공식을 찾아 2차 방정식 근을 계산한다. 연역 사슬의 탐색 결과를 세정하여 효율적인 알고리즘으로 요약 대량의 연습 예제들을 하나의 휴리스틱 규칙으로 변형

지도에 의한 학습(Learning by Taking-Advice) McCarthy 제안:충고를 이용하여 계획 형성할 것 → 70년대 후반까지 연구 미약 → 전문가 시스템 기술 발달로 전문가의 충고(지도, 전문지식)를 변형 → 전문가의 성능을 발휘하는 프로그램 연구 → 전문가 시스템 구축에 대한 연구 충고 습득의 단계 전문가시스템 구축 과정 1) 요구 단계: 전문가에게 충고 요구 → 전문지식 습득 2) 해석 단계: 내부 표현으로 변환 ↘ 3) 연산자화 단계: 연산자로 변환 ↗ 4) 합병 단계: 지식베이스로 합병 → 지식베이스 형성 5) 평가 단계: 실행 요소에 의한 결과 평가 → 추론 결과 평가 지식베이스 유지(maintenance): 지능형 편집기, 능동 표현 언어, 추적기능, 설명기능 지식 표현

유추에 의한 학습 이미 존재하는 지식을 변형하거나 증식시켜 새로운 사실이나 기술을 습득하는 학습방법 Carbonell의 추론에 대한 가설 "어떤 사람이 새로운 문제 상황에 직면하게 되면 그 사람은 현재 상황에 매우 유사한 과거의 상황을 상기(remind)한다." 과거와 현재 상황들 사이의 공통성 및 계획 성공적 적용 : 일반화에 대한 기초 제공 부적절한 적용 : 오류를 분석하여 계획의 적용범위를 제약하는 식별화 과정을 시작 성공, 실패, 부분적 성공 등 반응적 환경은 일반화나 식별화 과정을 위해서 절대적으로 요구

문제풀이와 유추 고전적 문제풀이 모델들, GPS, STRIPS, NOAH 등은 유사 문제공간에 있는 다른 문제들의 해결에 대한 경험을 이용하지 않음 원숭이, 바나나 문제의 2가지 상황 원숭이와 바나나 방안에 배고픈 원숭이 원숭이 손이 닿지않는 천정에 바나나가 걸려 있음 방 구석에 큰 상자가 있음(원숭이가 들 수 있고, 올라서면 천정에 손 닿음) 실험자와 바나나 실험자가 원숭이-바나나 문제 설정하려고 함 실험자는 바나나를 가지고 있고, 천정에 고리가 있음 과거문제에 대한 기억과 현재 문제에 대한 과거문제의 해결방법 인간은 익숙하지 않은 문제보다 익숙한 상황에서 문제를 더 잘 해결 기존의 목적-수단 방법에 유추적 변형과정을 추가, 과거의 경험을 이용하는 방법.

계획-변형 문제 공간(Plan-Transformation) 고전적 목적-수단 방법(means-end analysis)의 문제공간 현재 상태와 목표 상태 비교 차이를 줄일 수 있는 연산자 선택 적용: 적용이 불가능할 때 현재 상태 저장 후 부문제에 대해서 다시 목적 수단 방법 적용 부문제 해결 후 저장된 상태 복구 후 원 문제에 다시 적용 문제공간에서 과거 문제의 풀이에 대한 지식 도출 연산자, 초기 상태, 최종 상태를 포함하는 일련의 상태 풀이를 만족시키도록 하는 경로 제약 조건들 매크로 연산자 생성 매크로 연산자의 문제점 모든 풀이과정의 나열은 관리가 어려움 매크로 연산자의 적용은 경로에 대한 제약조건을 무시 부가적인 연산자의 대치, 삭제, 삽입하는 과정이 어렵다

차이함수 : 초기와 최종 상태 비교함수, 유사성 척도로 사용 Carbonell의 가설 유사문제에 대한 풀이 새로운 문제와 과거 해결된 문제의 초기 및 최종 상태 풀이에 필요한 경로 제약조건 새로 적용된 상황에 만족정도 차이함수 : 초기와 최종 상태 비교함수, 유사성 척도로 사용 Carbonell의 가설 적절한 유추적 변형을 찾는 것은 그 자체가 문제풀이 과정 단지 문제 공간만 다름 변형 문제 공간에서의 상태들은 원래의 문제공간에서 풀이 예제: 피츠버그에서 뉴욕으로의 여행 비행기 외의 여행 경험 없음 현재 비행기를 이용할 수 없음 다른 여행 수단 찾음(열차) 열차 여행 경험 없음 비행기 이용 과정 상기 열차 이용에 적용

예를 통한 학습 교사나 외부환경으로부터 주어지는 사실들로부터 귀납적 추론을 진행하여 일반적 개념을 습득하는 귀납적 학습 주어지는 것들 관찰적인 사실들 일시적인 귀납적 사실들 배경지식 찾아야 하는 것들 귀납적인 규칙 및 가설들(포괄적) 추론을 위한 제어 전략 상향식 : 자료 운용(data-driven)방식 입력으로 주어지는 사건 또는 사실들을 한 번에 하나씩 처리해 나가면서, 최종적으로 결합적인 일반화가 형성될 때 까지 현재의 묘사 집합들을 점진적으로 일반화 하향식 : 모델 운용(model-driven)방식 가능한 일반화의 집합을 탐색하여 특정의 요구조건을 만족하는 몇몇 개의 좋은 가설을 찾아내는 방식 혼합식 : 상향식과 하향식의 혼합

훈련예(training instance)의 성질 훈련예의 품질 : 모호성이 없어야 한다. 훈련 예의 오류 분류되지 않은 훈련 예 훈련 예에 주어지는 순서 훈련 예들이 탐색되는 방법 증진 학습을 수행하는 프로그램 능동적인 예제 선택을 수행하는 프로그램 탐색되는 방법 여러가지 대안 중에서 가장 가능성 높은 것을 선택 부가적인 훈련 예를 검사함으로써 가설 확신 기대에 따른 추출 : 가설들과 모순되는 훈련 예들을 선택

규칙 일반화 기법 서술 논리식 이용 조건제거(dropping condition)방법 대용 묘사를 첨가하는 방법 CTX, CTXi : 추가적으로 다른 표현들이 증식될 수 있는 임의의 개념 묘사 |< : 기호의 오른쪽이 더 일반적임 K : 특정의 개념 조건제거(dropping condition)방법 CTX & S ⇒ K |< CTX ⇒ K 예) (클로바 3)(클로바 5)(클로바 7)(클로바 10)(클로바 K)가 플러쉬 → 숫자에 대한 조건 제거 → 클로바 5장 대용 묘사를 첨가하는 방법 CTX & CTX1 ⇒ K |< CTX & (CTX1 or CTX2) ⇒ K 예) CTX1 → [color = red] CTX2 → [color = blue]

범위를 주는 방법(closing interval) CTX & [L = a] ⇒ K |< CTX & [L = a..b] ⇒ K CTX & [L = b] ⇒ K | 예) a: 정상온도, b:정상온도라면 → [a, b] 사이도 정상온도 일반화 트리를 올라가는 방법 CTX & [L = a] ⇒ K | CTX & [L = b] ⇒ K |  |< CTX & [L = s] ⇒ K | CTX & [L = k] ⇒ K | 상수를 변수로 변환하는 방법 F[a] | F[b] |< ∀vF[v]  | F[k] | polygon triangle pentagon rectangle

관찰을 통한 학습 비지도 학습(unsupervised learning) 귀납적 학습 방법의 가장 일반적인 형태 어떤 학습보다 학습자에게 더 많은 추론 요구 학습자에게 적당량의 예제 제공하지 않음 주어진 예제가 긍정적, 부정적이라는 어떠한 구별능력 없음 초점 맞추기에 심각한 문제 분류 : 관찰에 대한 인간의 이해와 이에 따르는 과학 이론의 개발을 쉽게 함 자동적으로 분류를 형성하는 방법의 문제 정의 주어지는 것들 객체들의 집합 객체들을 특정 지우는 속성들의 집합 형성된 분류들을 위한 배경지식(품질평가 기준, 제약조건, 속성의 특징) 찾아야 하는 것들 객체 집단들의 계층구조 결합적 개념 집단화 : 객체들을 결합적 계층 구조로 만드는 것

두 객체의 유사성 : 하나의 숫자(객체들의 기호적 묘사들을 유사성 함수에 적용한 결과값) 유크리드 거리(Euclidean Distance) 유사성 측정 context-free: 객체들의 성질만 고려, 주위상황 무시 context-sensitive: 두 객체와 주위 객체 상황을 함께 고려 거리 개념: 유클리드 거리 + 주위 객체와의 상대 거리 근접한 객체들을 고려하는 것은 집단화 문제를 해결하기는 하지만 일반적으로 부족 → Concept-free 문제 → 이러한 방법으로는 객체 집단에 대한 게슈탈트한 성질을 이끌어 낼 수 없다 게슈탈트한 성질 : 특정 집단을 개별 대상의 성질로부터 유도하는 것이 아니라 전체적으로 특징지우는 것

개념적 응집성 (conceptual cohesiveness) Conceptual cohesiveness(A, B) = f (A, B, E, C) A, B의 개념을 고려한 유사성 C: 직선, 원, 사각형 등의 형태들의 개념 E: 주위의 점들 f (A, B, E, C) = maxi [ #e(i) -1 / area(i) ] i : A, B를 커버하는 C의 형태들의 인덱스 #e(i) : 형태 i에 의해 커버되는 E내의 점의 개수 area(i) : 형태 i의 면적 A B

유전자 알고리즘(Genetic Algorithm) 진화 계산(evolutionary computing) 유전자 알고리즘(genetic algorithm) 진화 프로그래밍(evolutionary programming) 진화 전략(evolution strategy) 1960년, 70년대에 시작, 1980년대에 주목 현재 가장 성공적인 학습 알고리즘 자연 세계의 두 기법 적자 생존(survival of the fittest): 문제 해결기법 DNA: 코딩 기법 Darwin’s finch: 갈라파고스에 사는 되새류 부리가 작은 콩새의 일종으로 지리적 격리에 따른 종의 진화를 설명, 진화론 근거

생물학 연구 결과 다윈의 ‘종의 기원(The origin of species) 자연 선택(natural selection) 치열한 생존 경쟁에서 이긴 개체만이 살아 남는다. 예) 큰 코를 가진 사람은 세금 면제할 경우 500년 후에는 모든 미국인은 큰 코를 가질 것이다(?) 1953년 Watson과 Crick의 DNA 나선형 구조 4개의 문자(C, G, A, T) 언어로 유전 정보 표현 인간 유전자 명령어 집합은 삼십억 개의 문자 길이: 수천 권의 성경 분량 유전자 코딩 정보를 전달

자연 선택 기법 최적화와 진보를 위한 자연의 해결 방식 장점 단점 견고성과 내재된 병렬성 대규모의 실험을 동시에 수행 모든 돈을 한 마리 말에 올려 놓지 않는다. 최적화와 진보를 위한 자연의 해결 방식 지역적인 최적화에서 고착되거나 해결책을 간과하지 않음 발견될 것이 있으면 항상 발견한다. (If there is something there to be found, it usually is.) 단점 개체의 대량 과잉 발생 종의 개량이 우연적인 요소에 좌우 전체 과정이 목표를 가지지 않는다. 유전자의 돌연변이에 의해 진화 원숭이가 워드프로세서를 망치로 두드려서 ‘Song of Songs’를 타이핑할 확률?

유전자 알고리즘 적용 절차 문제를 제한된 알파벳의 스트링으로 코딩 컴퓨터내에서 해답들이 투쟁하고 결합할 수 있는 인공환경을 생성 적합 함수(fitness function)을 설정 후보 해답의 결합 방법을 개발 부모 스트링을 잘라 붙이는 교차(cross-over)를 사용 복제에서 모든 종류의 돌연변이 연산자가 적용가능 잘 분포된 초기 개체를 생성 및 진화 각 세대에서 부실 해답을 제거(도태)하고 우수 해답 개체의 자손으로 ‘진화’하도록 함

유전자 알고리즘의 응용 기본적인 구조는 간단, 구현이 용이 코딩(표현 공학: representation engineering)과 효과적인 돌연변이 연산자 발견이 중요 잡지 데이타베이스에 대한 적용 사례 군집(clustering)하는 데 사용 문제를 알파벳의 스트링으로 코딩하는 방법 군집을 탐색 공간의 안내 좌표(guide point) 집합으로 표현 안내좌표에 따라 잘 군집된 결과 두 안내좌표의 경계 두 점에서 동일한 거리에 있는 선 보로노이 다이어그램: 경계에 따라 구역이 구분 후보 해답을 코딩: 5개의 안내 좌표로 된 스트링

보로노이 다이어그램의 예 잘 군집된 잡지 데이타베이스