Research Presentation -related in NLP

Slides:



Advertisements
Similar presentations
SPEAKER VERIFICATION SYSTEMS 대화형 사용자 인터페이스 개론 정보와 추론 연구실.
Advertisements

취업, 막막하세요 ? 걱정되십니까 ? 성공취업으로 가는 길 『경기청년뉴딜』이 함께 동행해 드립니다 ~ 일시 : ~ 대상 : 2013 년 2 월 졸업예정자 ( 기 졸업자 포함 ) 로서 경기도 거주자 문의 ∙ 접수 : 취업지원센터
Big Data & Hadoop. 1. Data Type by Sectors Expected Value using Big Data.
인공지능 소개 부산대학교 인공지능연구실. 인공 + 지능 인공지능이란 ? 2.
Lesson 11 What’s Your Type? 여러분의 유형은 무엇인가요 ?. What job do you want to have in the future? 여러분은 미래에 어떤 직업을 갖고 싶은가 ? p.218.
PRESENTATION EMBEDDED AND BIO DATABASE LAB YONSEI UNIVERSITY, XX JUNGRIM KIM.
What Opinion mining? Abstract 이 논문에서는... 1.Different granularity levels (word, sentence, document) 2. Discussion about terms of challenges 3. Discussion.
7장 텍스트의 처리 7.1. 자연어 처리의 개요 자연어 처리의 중요성 자연어 처리의 기반 기술
의문사 + to 부정사 주어 To study hard is important.
Deep Learning.
Predicting User Interests from Contextual Information
1953년 설탕회사로 시작한 제일제당의 영문사명이 CheilJedang Corp.에서 CJ Corp.으로 변경.
Hamming Code 이근용. 2 Error Control Error Detection Parity Check CRC Check Error Correction Hamming Code.
FREE ONLINE WHITEBOARD TOOLS
English Communication R/W
Introduction to Django
Data Interface, Data mart Technology
CADian Elect-CAD 2006 전기설비 설계 및 물량 자동산출 프로그램.
A CRM Consulting case with Point of Sales Data
제 09 장 데이터베이스와 MySQL 학기 인터넷비즈니스과 강 환수 교수.
REINFORCEMENT LEARNING
Electronic Teaching Tools
제4장 자연언어처리, 인공지능, 기계학습.
Delivery and Routing of IP Packets
A STUDY FOR RFID APPLICATION OF CONSTRUCTION MATERIALS.
Dr. Mike Eisenberg 교수가 개발한 21세기 문제해결법: Big 6
Information Technology
Internet Computing KUT Youn-Hee Han
Learning Classifier using DNA Bagging
This is our standard presentation Cover slide; the images used here are meant to provide a quick, pleasing representation of ProQuest content areas. The.
Word2Vec Tutorial 박 영택 숭실대학교.
Ch. 5 : Analog Transmission
1 도시차원의 쇠퇴실태와 경향 Trends and Features of Urban Decline in Korea
MicroStrategy6 컴퓨터학과 석사 2학기 진수경.
숭실대학교 마이닝연구실 김완섭 2009년 2월 8일 아이디어  - 상관분석에 대한 연구
KMS 구현 및 활용사례 경쟁력 강화를 위한 2002년 5월 28일(화) 김 연 홍 상무 / 기술사
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
제 8 장 객체지향 데이타베이스와 데이타베이스의 새로운 응용 분야
정보 검색 연구 내용 및 연구 방향 충남대학교 정보통신공학부 맹 성 현 데이타베이스연구회 2000년도 춘계 튜토리얼
11차시 2교시 인적자원개발 학습과 전략 학습 목차 1. 학습개요 2. 사전학습 3. 본학습: 2교시 인적자원개발 학습과 전략
HTTP 프로토콜의 요청과 응답 동작을 이해한다. 서블릿 및 JSP 를 알아보고 역할을 이해한다.
Course Guide - Algorithms and Practice -
Push Notification의 현재와 발전방향
Introduction to Computers
9. Do You Have a Scientific Mind?
: 부정(negative)의 의미를 나타내는 접두사
Problem-Based Learning
성공어린이를 위한 확실한 선택과 투자! 학부모님께! 우리 귀한 자녀의 배는 어디를 향해 가고있습니까?
Hijacking Bitcoin : Routing Attacks on Cryptocurrencies Maria Apostolaki Aviv Zohar Laurent Vanbever Presentor Geun Woo Lim Many parts of.
기상 레이더 정보를 이용한 획기적인 LID시설 제어 방법 GIST대학 물리학부 정희원 GIST대학 기초교육학부 박연준, 기태윤
Insight Deep MininG 건강을 위한 마이너스, 무첨가 식품 인사이트코리아/식품음료신문 공동 기획 기사
Text Mining (Parsing) with R
데이터마이닝, 빅데이터, 데이터과학: 정의 데이터마이닝(data mining)
이게 이게 뭐예요? 시계예요. Sogang Korean 1A Preparing UNIT 2 “이게”
Extracting Schedule Information from Korean
Flow Diagram IV While.
The World of English by George E.K. Whitehead.
1. 관계 데이터 모델 (1) 관계 데이터 모델 정의 ① 논리적인 데이터 모델에서 데이터간의 관계를 기본키(primary key) 와 이를 참조하는 외래키(foreign key)로 표현하는 데이터 모델 ② 개체 집합에 대한 속성 관계를 표현하기 위해 개체를 테이블(table)
소프트웨어 종합설계 (Software Capstone Design)
Course Overview Information Literacy.
Web based Presentation & Controller Service
텍스트 분석 ㈜ 퀀트랩.
Hongik Univ. Software Engineering Laboratory Jin Hyub Lee
Total Physical Response
가톨릭관동대학교 휴먼재활서비스학부 (언어재활상담전공)
USB Drivers install Manual
COS Scholar Universe “Find Scholarly Experts on any Topic”
6 객체.
Chapter 7: Deadlocks.
Sawasdee ka.
Presentation transcript:

Research Presentation -related in NLP Speaker – Won Jae Lee (ASH)

대규모 코퍼스기반 자동으로 문법 규칙 및 정보 추출하는 방법 Edit: A Broad-Coverage Grammar Checker using Pattern Grammar Chung-Chi Huang, Shih-Thing Huang Mei-Hua Chen, Jason S. Chang Information Extraction from Web-Scale N- gram Data Niket Tandon Gerard de Melo

데이터로부터 무수히 많은 사실들을 얻어낼 수 있다는 사실 빈라덴과 데이터의 관계? 데이터로부터 무수히 많은 사실들을 얻어낼 수 있다는 사실

왜? 수동적 규칙 부여와 한정된 패턴 추출 & 정제된 코퍼스로부터 문법 패턴을 자동으로 추출 사용자의 문장과 비교 후 정확한 문장 제시 작은 규모의 코퍼스로부터 부정확한 관계 정보를 추출 → 웹을 기반으로한 대규모 코퍼스로부터 많은 시간을 소 요하지않고 정확한 관계를 도출

발전해온 과정 문법 오류를 식별 수동적으로 부여된 규칙을 바탕으로 오류 식별 POS 태깅과 n-grams 등을 혼합하여 오류 식별 통계적인 방법 도입시도 ---- 한가지 관계만을 찾아보기 매우 구체적인 정보를 단일 웹페이지에서 추출 좀더 많은 웹페이지에서 정보 탐색 속도를 향상시키려는 시도

저자들의 시스템이 더 우월한 이유 전반적으로 폭넓게 문법 오류를 검사하고 많은 규모의 텍스트로부 패턴을 추출하여 단어의 교체, 삽입, 삭제까지 자동적으로 계산하여 제시 ---- 유용성 N-gram 데이터의 확장가능성

완성된 예제 (Edit)

완성된 예제 (N-gram) isA(Laden, terrorist) part of(Laden, zihard) hasProperty(Laden, cruelty)

구현방법 Edit Lemmatizing, POS Tagging and Phrase chunking. N grams and Collocations. Constructing Inverted Files. Deriving pattern rules N-gram 1) Gather a set of patterns 2) derive a vector representation for each candidate tuple 3) Based on a training set of labelled tuples, a learning algorithm finally determines which candidate tuples should be accepted

Edit 구현 Using ‘GRASP’ -> computer-assisted language learning For (2), we use MI value →

Algorithm in Edit system

N-gram 구현

어떻게 패턴을 찾아내는가? 1) Concept Net 2) PMI score

트레이닝 벡터 생성 Manually tag labels l(x,y)

도출된 결과 평가 시험 환경 Use British National Corpus as general corpus C. Exploit GENIA tagger to get the lemmas, PoS. Examine three types of errors and mixture of them for correction system Compare the result with MSR ESLs Edit is easily accessible and effective in both grammaticality and usage check. For the evaluation, we used 3 different sources of n-gram statistics. Also, we choose 3 relations which fulfill the conditions earlier existed. We labeled data and got results with table shown below.

How to extract the pattern and match “He play an important roles to close this deals. He looks forward to hear you.” → give a suggestion how to correct How to find the relationship from the information → trying to find the relationship between play and role if there is such tuple

의견 발전방향: 문법 패턴 교정에서 나아가 문단, 페이지, 글 전체를 의미에 맞게 교정하는 시스템 완성. 발전방향: 단어사이의 관계 도출에서 확장하여 여러 단어의 관계 도출, 복잡한 관계식 유도, 가 지고있는 한계점들을 개선하여 실용가능성 있 는 프로그램 완성.

감사합니다.