자연어처리 기초 번역 엔진 연구팀 손성준.

Slides:



Advertisements
Similar presentations
개인의견 차가있을수있음 훈훈한남자 배우 TOP 5. 5 위는 박보검 웃을때보이는 치명적인 미소 꺄 ~~~ 5위5위.
Advertisements

 사회  4 학년 1 학기  1. 우리 시ㆍ도 모습 > (1) 지도에 나타난 우리 시. 도의 모습 (2/17) 지도를 알아보자 (1)
Enjoy + …ing : … 하는 것을 즐기다 I enjoy doing a computer You enjoy doing a computer She enjoys doing a computer He enjoys doing a computer We enjoy doing a.
Classroom English How do you say _________ in Korean? _________ 는 한국어로 뭐예요 ?
1 매쓰홀릭 설명회. What Do You Want? 자유로운 활용 - 컨텐츠 수 평 학 습.
녹는점과 끓는점 화학과 이 언정 손 나영 《수업 계획서》
지금 우리 지구는 HOT, HOT 에너지자원. 아이스에이지 2 시청 초 1-11 기후변화의 주된 원인인 지구 온난화 현상을 알고 온실가스의 영향을 실험을 통해 확인할 수 있다. 학습목표 초 1-11.
한글자모의 새로운 교수법 기초반의 한글자모 지도와 기초문법지도의 구체적 안내 뉴져지 한국학교 교장 전현자.
■ 지도교사 : 박정희 광덕고등학교 동아리 –어벤져스-
아동이 살기 좋은 횡성군 만들기 추진위원회 2차 모임
언어와 문법 (languages, grammar)
한국 경영학 교수인력 수급에 관한 연구 (사)한국경영교육인증원 연구책임자 : 김민수 공동연구원 : 김주엽
밥상의 희로애락 제 5 강 욕망의 밥상 - 탐식 GOOD JOB 식사하셨나요?.
저탄소 사회를 위한 신재생에너지 보급사업의 방안
목 차 Context Of Presentation 검토 배경 IT 산업의 정의 및 특징 우리나라 IT 산업의 현황
03월 식단표 So hot 비빔’s 덮으면 모락모락 보라매 도시락 03/21 (월) 03/22 (화) 03/23 (수)
여름방학 제대로 즐기기 HOT SUMMER 컴퓨터 특강 마 재 초 컴 퓨 터 실 T) /
말뭉치 기반 형태소 및 의미 태깅 시스템 발표자 : 신준철
서울특별시 마포구 (
& 국민연금법 국민건강보험법 사회복지법제 행정학부 김인철 사회복지학과 김건우
1. e-ELF English ‘Hello song’ 인사하기 2. 배경 지식 쌓기: 탈것에 대해 알기
제 6장 증권분석 (기본적 분석) 소비자 아동학과 최랑 기본적분석.
시대의 향기를 담은 고수필 고전문학원전강독 신태웅 김수연 이진솔.
“자연어처리” 소개 (Natural Language Processing)
문화이벤트 특강 시민축제에 대하여 애니메이션 김철환.
창의 경영 학교 2011 사교육절감형 학 성 초 등 학 교 (목) 집중컨설팅 안녕하십니까
커뮤니케이션 스킬 UP -전화매너- ..
이 재 호 (Ph. D. in Edu.) 광주교육대학교 윤리교육과 교수
행정자치부 성과관리체계
기획서의 조건과 역할 기획서는 아이디어가 장차 창출할 가치를 명확히 보여 주어야 한다. 기획서 채택 가치 창출 체 제 표 현
2016학년도 2학기 수강바구니(수강신청) 안내 매뉴얼
2016학년도 1학기 수강바구니(수강신청) 안내 매뉴얼
제13장 종합적 설비관리 마스터 제목 스타일 편집 공업경영과 경제 마스터 텍스트 스타일을 편집합니다 둘째 수준 셋째 수준
제2절 법인세의 계산구조와 세무조정 1. 각 사업연도소득에 대한 법인세 계산구조 회계와 사회 결산서상 당기순이익
한국어 통사론의 기본 개념 통사론 기초
Sung-Hae Jun 자연어 처리의 이해 Sung-Hae Jun
연구기획 및 연구개발 과정에서의 특허정보 활용
2014년 2학기 경희대학교 국어국문학과 담당: 김양진
소프트웨어 공학 (Software Engineering) 요구 분석 (Requirement Analysis)
BLACK OUT 신개념 연합동아리 블랙아웃에서 1기를 모집합니다!
사회복지 법제론 /노인장기요양보험법 문은홍 조소라.
TPM 과 6σ 의 비교 구 분 TPM 6 시그마 추진방식 사 상 활동 단위 강 점 범 위 Level up 기 법 활동단계
제6장 기본적 분석.
모두가 행복한 교육, 미래를 여는 창의인재 2015 개정교육과정 서울숭인초등학교 교사 이소정.
한국어 읽기 교수법.
이학적 검사론 과 목 : 이학적 검사론 담당 교수 : 김형민 교수님 학 과 : 작업치료 과 학 번 :
각종 연결 프로그램이 실행되지 않을 때 도움말을 클릭하세요
자원봉사의 가치와 지향 전라북도자원봉사종합센터 연구협력부장 서병철 전주카리따스 봉사단 교육.
목적을 갖고 살아요!.
공공기관의 통합성과관리시스템 구축방안 ㈜아이에스앤에프 대표 박정수 ㈜아이에스앤에프.
재활용의 실태와 재활용품 만들기의 계획 실과 6학년 8 . 환경을 살리는 나의 생활> 2) 재활용품 만들기(5~6/8)
신체활동 동아리조직화 전략과 협업사례 박평문 제1기 국민건강을 위한 신체활동사업과정
10. 중간언어의 생성 소 개 문법-지시적 변환 코드 생성 U-코드 번역기.
나비는 두 꽃 중에서 어느 꽃으로 날아 갈까요? 한 장미꽃은 향기가 나고 한 장미꽃은 악취가 납니다 두 개의 장미꽃이 있습니다
영어 8-a단계 A Special gift (3/8) 3. A Special Gift After you read.
아동안전관리 홍성훈 교수님 아동보육학과 박윤희
제 10장 가족치료모델 발 표 : 여금란.
6 정보 설계 웹 기획 : 성공적인 웹사이트의 첫 번째 조건.
도덕과 교수-학습 모형 초등특수교육과 나성령.
CONTENTS Part1. 조사 개요 / 3 1. 조사 목적 2. 조사 설계 3. 주요 조사 내용 4. 응답자 특성 5. 지수산출방법 Part2. 결과요약 및 제언 / 9 Part3. 조사결과 분석(만족도) / 종합 및 차원 만족도 2. 항목 만족도 3.
1장 듣기 교육론 개괄.
MANIMAL 과 협상의 기술 TOB-DOWM 협상은 신사들의 게임이 아니다. 3. 협상할 때는 상대편의 눈길을 피하지 말자
곱셈(3) 수학 3학년 1학기 6. 곱셈 (3/9) 수업계획 수업활동 -학습진행내용- O 수업 시작하면서 제시되는 화면이다.
곱셈(4) 수학 3학년 1학기 6. 곱셈 (4/9) 수업계획 수업활동 -학습진행내용- O 수업 시작하면서 제시되는 화면이다.
재미있는 놀이, 문제 해결하기 수학 3학년 2학기 8. 문제 푸는 방법 찾기 (4/6) -학습진행내용-
언어 단위(linguistic unit) 단어(word) 형태론과 통사론
8단계 3층을 완성한다 Case 1 Case 2 Case 3 Case 4
유통경영학과 하성훈 유통경영학과 김병율 기계공학과 배용진
“사업주 부정수급 Clean Up 캠페인”.
영어문장구조의 이해 제출자: 영어영문학과 신진희.
Presentation transcript:

자연어처리 기초 번역 엔진 연구팀 손성준

언어의 유한 오토마톤 모델 언어의 수학적 모델 설명 문법 Analysis in With community 언어는 일종의 골격을 가짐(문법) 문법 인접 단어끼리 가져야 할 제약 Analysis in With community Analysis : N, in : PREP With : PREP, community : N

문맥 자유형 문법 인접 단어의 제약 표현 정규 문법 영어와 같은 종류 언어 적용 용이 유한 오토마톤의 한계 인접 단어 제약 가능 떨어져 있는 문자열의 상관관계 표현 불가 영어와 같은 종류 언어 적용 용이

형태소 해석 개요1/5 문장을 사전에 등록된 최소 단위로 분해 자연어 처리 1단계 음소(phoneme) 인간의 의미(의지) 전달에서 음성을 어떻게 사용하는가를 기초로 생각한 음의 단위

형태소 해석 개요2/5 형태소(morpheme) 단어(word) 의미를 가진 최소의 언어 단위, 하나 이상의 음소로 구성 하나의 의미의 총합을 이루며, 문법상 하나의 기능을 가진 최소의 언어 단위, 하나 이상의 형태소로 구성

형태소 해석 개요3/5 문장(sentence) 문, 텍스트(text) 전달하고자 하는 내용을 가지며, 완결된 언어 단위, 하나 이상의 단어로 구성 문, 텍스트(text) 전달하고자 하는 내용을 표현하기 위하여 문장이 순서대로 모여진 집합 인접하는 문장 상호간에는 어떤 종류의 관계성이 존재

형태소 해석 개요4/5 나는 너를 사랑한다. 나는 너를 사랑한다. 나+아는 낳+아는 나+는 날+는 너+를 너르+ㄹ 사랑+하+ㄴ다+.

형태소 해석 개요5/5 비텔비(Viterbi) 알고리즘 은둔 마르코프 모델(HMM)

구문 해석 개요1/3 자연언어의 구조를 문법규칙에 기초하여 복원 처리하는 것 영어에서는 구문 해석이 중요 한국어 같은 교착어는 구조가 미약

구문 해석 개요2/3 문맥자유문법(CFG)의 생성 규칙이 아래와 같이 주어질 때 [1] S   → NP VP [4] VP → V [7] PP → PREP NP [2] NP → N [5] VP → V NP   [3] NP → DET N [6] VP → V NP PP

구문 해석 개요3/3 Top-Down 알고리즘 Bottom-Up 알고리즘 S부터 시작하여 차례로 규칙을 적용해서 주어진 그림을 얻어질 때까지 반복하는 방법 O(kn) Bottom-Up 알고리즘 입력문(bottom)에서 S를 만들어 가는 방향으로 해석 O(nk)

의미 해석1/3 격문법(case grammar) 어와 어 사이의 의미관계를 동사를 중심으로 다룬 것

의미 해석2/3 의미소에 의한 해석 용례, 시소러스에 의한 해석 의미의 기본 단위인 의미소(semantic premitive)라는 것을 이용하여 의존관계의 제약(restriction)을 기술하는 방법 의미 속성 용례, 시소러스에 의한 해석 걸다 1(희망, 기대 등을 갖다) :     「그」가 「아들」에 「희망」을... 걸다 2(물건을 걸다) :       「그」가 「벽」에 「그림」을...

의미 해석3/3 연상관계에 근거한 의미적 애매성 해소 떨어져 있는 단어 사이에도 의미적인 정합관계가 존재 사전의 정의문 코퍼스

코퍼스란...1/3 언어 데이터를 대량으로 수집하고 언어 현상의 조사, 통계처리 등을 목적으로 수집된 언어 데이터 텍스트 코퍼스 음성 코퍼스

코퍼스란...2/3 Penn Treebank의 작성 과정 의미 정보는 없음

코퍼스란...3/3 인간에 의한 언어지식의 기술 컴퓨터 시스템에 의한 자연언어처리 시스템 처리결과의 평가 COBUILD English Dictionary 컴퓨터 시스템에 의한 자연언어처리 형태소정보, 구문정보가 부가된 코퍼스가 있으면, 형태소해석, 구문해석을 위한 우선규칙의 파라미터를 계산 코퍼스로부터의 학습에 의해 문법, 격프레임등의 언어지식을 자동적으로 획득 시스템 처리결과의 평가

기계 번역1/16 번역(translation) 어떤 언어(원 언어)의 텍스트를 다른 언어(목적 언어)의 등가의 텍스트로 치환하는 것 단어와 구조의 등가성을 중시하는 번역 의미 내용의 등가성을 중시하는 번역 사회적 이해의 등가성을 중시하는 번역

기계 번역2/16 번역의 어려움 어휘 대응의 차이 단어와 구의 대응 "(옷을) 입다",  " (안경을) 쓰다", "(모자를) 쓰다", "(신발을) 신다 put on 단어와 구의 대응 탕 hot water

기계 번역3/16 구조의 차이 다른 품사간의 대응 He wears a black suit 그는 검은 셔츠를 입고 있다 자극성 기체 -> 명사 + 명사 stimulative gas -> 형용사 + 명사

기계 번역4/16 명시적으로 표현하는 정보의 차이 번역의 요소 합성에 있어 비단조성 수(단수, 복수)의 정보 (영어O, 한국어X) 번역의 요소 합성에 있어 비단조성 논문 – paper, 박사의 – doctoral 박사의 논문 - doctoral thesis

기계 번역5/16 기계 번역의 단계 해석, 변환, 생성 기계 번역 시스템 구문 변환 방식 지식형 기계 번역 실례형 기계 번역

기계 번역6/16 구문 변환 방식 어휘와 문법에 관한 언어적인 지식 활용 해석 표현적인 격구조 생성 목적언어의 구조로 변환 목적 언어의 표층 표현 생성

기계 번역7/16 해석단계(일영 번역 시스템) 형태소해석 단어의 품사의 애매성 해소 복합어 처리 연용형의 동사 처리 병렬 명사구의 처리 명사내의 구조 해석 단문내의 구조 해석 ~は(~은)의 처리 명사구, 동사구 간의 의미적 관계 분석 시제, 양상의 해석

기계 번역8/16 변환 단계(일영 번역 시스템) 어휘 변환 구조 변환

기계 번역9/16 생성 단계(일영 번역 시스템) 생성 사전 검색 필수격의 생성과 구구조에서의 위치 결정 임의격의 생성과 구구조에서의 위치 결정 수동 변형, 혹은 대동사의 사용 결정 동사구 처리 it ~ that 변형 병렬 명사구, 동사의 등위 접속의 축약 관계절의 변형, 축약 there 구문의 사용 부사, 전치사의 위치 결정

기계 번역10/16 지식형 기계 번역(KBMT) 중간 과정에서 개념의 형성이 필요 격구조에서는 언어 종속적 규칙을 적용해서 올바른 번역이 될 수 없다고 봄 대상 분야의 지식을 개념 체계화 필요 추론을 통한 고품질 번역 가능

기계 번역11/16 KBMT의 번역 방식

기계 번역12/16 해석 변환 생성 원언어의 입력문을 해석 모듈로 해석하고 개념 표현으로 사상 얻어진 개념 표현을 목적 언어에 맞는 개념 표현으로 변환 생성 해석과 역방향 처리를 함으로써 개념 표현에 대응하는 목적 언어의 문 생성

기계 번역13/16 개념 정의(표현) 개념 변환 통상의 단어가 갖는 뜻을 개념으로 구성 상속, 재정의 가능 개념 표현이 완전히 중립적이지 못해서 개념 표현을 근사적인 다른 개념으로 바꾸는 것 사영 : 특정 슬롯의 삭제 범용화 : 어떤 개념을 그 상위 개념으로 치환 특수화 : 어떤 개념을 그 하위 개념으로 치환

기계 번역14/16 KBMT의 특징 대상 분야 지식의 이용 지식 표현과 상속 중간 언어적 방식의 개념 표현 추론과의 통합 다언어간 번역

기계 번역15/16 실례형 기계 번역 방식(EBMT) 어떤 문장과 비슷한 문장은 원래의 문장과 주로 비슷한 구조나 의미로 번역된다는 기본 원리에 입각 Swimming is good for you. Vegetables are good for you. > 야채는 몸에 좋다. Swimming is good for you. > 수영은 몸에 좋다.

기계 번역16/16 자연언어 소수의 추상화된 규칙 집합의 한계 풍부한 실례와 용례를 이용하는 것이 유효할 것 개개 단어의 개별성과 방대한 다의성 소수의 추상화된 규칙 집합의 한계 풍부한 실례와 용례를 이용하는 것이 유효할 것