색인이란 어떤 문서에 대해 그 문서를 다른 문서들로 부터 구별할 수 있도록 선택 단서가 되는 단어 또는 단어구 등을 추출하는 것 정보원과 정보입수자 사이 위치하여 정보를 전달시키는 장치 정보원색인 정보 입수자.

Slides:



Advertisements
Similar presentations
Business Model. CopyrightⓒSunRiver leehyekang.blog.me Business Model 01 BM이란?02 BM 구성요소03 BM 분석04 성공적인 BM의 조건05 모바일 BM.
Advertisements

개 요 2. 주요쟁점 3. 도시철도의 가치 4. 결 론 3 노선도 4 1. 개 요 사업개요 추진경위.
언어에 관한 노트 회화과 이 금주.  테마현대미술 노트 (1980 년 이후 동시대 미술 읽기 - 무엇을, 왜, 어떻게 ) 중 언어에 대한 장을 선 택하였다. 평소 이론서에 대한 책을 많이 읽고 있고 미술에 대한 비평에 관심이 많았기 때문에 선택한 장이다.  언어를.
서비스 제휴 제안서 네임스토리 1. 회사소개/조직도 2. 서비스 소개 3. 제휴서비스 제안 Table of Contents.
 질량 작용의 법칙 The Law of Mass Action  동적 평형 상태의 용액의 행동을 기술하고 예측 하는 수학적 모델 (wikipedia)  평형을 이루는 용액의 용존 성분들의 활동도 간 의 관계를 기술하는 법칙.
한글자모의 새로운 교수법 기초반의 한글자모 지도와 기초문법지도의 구체적 안내 뉴져지 한국학교 교장 전현자.
소규모 사업장 환경법령 등 관리실무 소규모 사업장 환경법령 등 관리실무 환경감시단.
2. 추진사례(2) 나. 모집단위 광역화 추진절차 1) 모집단위 광역화를 대비한 기초연구 및 조정안 마련
일본 츠크바 익스프레스 건설과 지역개발 김 태규 일본 운수정책연구소 연구위원.
무역환경정보네트워크(TEN) 사업 내용 소개
지속 가능한 세상 5학년 1반 15번 기은.
자료구조: CHAP 7 트리(1) 순천향대학교 컴퓨터공학과 하 상 호.
시각 커뮤니케이션 으로서의 광고 영상문화의 이해 3조 김치웅 김태현
SBS아트텍 홍보영상물 시안 2안 (가안).
경부운하건설 개요와 공학적 문제점 (목) 관 동 대 학 교 박 창 근.
( )가 교환을 촉진 시킬 목적으로 제 6장 광고(Advertising) 의의 매체를 이용하여 주로 ( )로 행하는
멤브레인 산기관 (Membrane Diffuser)
세계10대 건축물.
제 7 장 문장 구조화 제어문 지정문 조건문 반복문 GOTO 문 비결정적문.
2.2 CPU 스케줄링의 목적과 유형 스케줄링의 목적
Creo Parametric 2.0 Interface
산업보건위생 소음평가와 관리 안전분야–교육자료 미디어개발
R.W.M 익스팬션 죠인트 차수공법 (특허 제 호)
Power Java 제7장 클래스와 객체.
A Survey of Affect Recognition Methods :
기계공학과 D조-손세민 봉하경 서홍우 서정훈 이태우 이희준 이한솔 이태규
분자기계 [2016년 노벨 화학상] 베르나르트 페링아, 최초의 분자 모터 개 발
바이오칩의 현황과 미래 생명공학지원과 신희정.
한국방송통신대학교 교육학과 졸업논문작성지침
7장 비용우위와 가격경쟁 발 표 : C 조 2010년 10월 27일 조 원 : 이춘란, 황병운, 이승재 WAL- MART.
3D 프린팅 프로그래밍 06 – 에펠탑 만들기 강사: 김영준 목원대학교 겸임교수.
Environmental Impact Assessment
2011년 7월 상품판매 방향 Agt교육용 부산AM사업단 부산AM2팀장 김 희 경 -고맙습니다~ 사랑합니다~ 성공합시다~-
presentation 글꼴 지정 파워포인트 2007
1강 Creo Parametric 3.0 시작 설정 컴퓨터 응용 설계 Tel. :
인천 장로성가단 New York 카네기홀 연주 9박 11일
KOREAPLATFORM & H.C B2B/B2C Process
-보다 더 말하기 수업이 많아요? 네, 말하기 수업이 듣기 수업보다 더 많아요.
오라클 쿼리 문제 EMP (사원 테이블) DEPT (부서 테이블) 컬럼명 설명 EMPNO 사원번호 ENAME 사원명 JOB
1. 예수 따라 가며 복음 순종하면 우리 행 할 길 환 하 겠 네 449 장
Thévenaz의 현상학과 철학적 이성의 조건
이것만은 기억해라!! (크리에이티브한 광고 만드는 방법 3가지) 광고 홍보 학과 박태진.
세계의.
대체 에너지 - 태양에너지 자연과학부 물리학과 김형욱.
동아 토목인의 날 및 취업 Camp Day 11학번 김기덕 부산교통공사 신평지사.
산업용 목재펠릿 보일러 지원 업체를 위한 설명회(’ ) 국내외 목재펠릿 제조업체 현황 한국펠릿연료협회.
알고리즘의 분석(analysis) 공간적 효율성(Space Efficiency)과 시간적 효율성(Time Efficiency)
디지털회로설계_강의안5 7. 가산기와 감산기 회로.
알고리즘(Algorithm)  알고리즘 개요 (효율, 분석, 차수) Part 년 봄학기
미래환경 기업 - (유) 인플러스텍 이온화가스를 이용한 제철 폐수 처리기술 (유) 인플러스텍 환경팀 김 민 정.
INTRODUCE INICIS Service 신용카드 ARS 사용 메뉴얼 PREMIUM PG INICIS
광학적 모형안 헬름홀쯔-로렌스 모형안.
유도 전동기의 회전원리 앞서 변압기를 설명할때 언급한 바와 같이 유도 전동기는 변압기의 원리 와 거의 같습니다.
OpenGL (3D Racing) PROJECT 2011 Dongseo Univ..
Alliance Proposition 파워인슈닷컴.
Industrial materials 전자 전기 정보 통신 P.T 발표자 온승윤 전자 분야용 섬유 II 전자파 방어용 소재.
1강 Creo Parametric 3.0 시작 설정 컴퓨터 응용 설계 Tel. :
알고리즘의 분석(analysis) 공간적 효율성(Space Efficiency)과 시간적 효율성(Time Efficiency)
Homework #5 (1/3) 다음을 수행한 후, 결과 파일들을 출력하여 제출한다.
Software Engineering Project
Home&Shopping (식품 상품군) QA 업무 절차 안내서.
Soribada Education 서비스안내
Home&Shopping (생활용품 상품군) QA 업무 절차 안내서.
소규모 공공하수처리시설 기술지원 사례 전북지역환경기술개발센터 김 영 일.
창원대학교 녹색기술기반해양플랜트인재양성센터 제1회 학생포트폴리오 경진대회
창원대학교 녹색기술기반해양플랜트인재양성센터 제2회 학생포트폴리오 경진대회
얼굴 기반 신원 확인 및 의도 인식 포항공대 김대진 교수 세계적인 경쟁력을 확보한 기술적 성과
알고리즘의 분석(analysis) 공간적 효율성(Space Efficiency)과 시간적 효율성(Time Efficiency)
Report #3- 문제 1 Set(집합) 추상 데이터 타입을 정의하고, 다음과 같은 연산자들을 포함시켜라. 여기서 S, S1, S2는 집합을 나타내고, i는 집합 원소를 나타낸다. 연산 의미 create() Return {} insert(S, i) If i є S then.
Presentation transcript:

색인이란 어떤 문서에 대해 그 문서를 다른 문서들로 부터 구별할 수 있도록 선택 단서가 되는 단어 또는 단어구 등을 추출하는 것 정보원과 정보입수자 사이 위치하여 정보를 전달시키는 장치 정보원색인 정보 입수자

색인과정 C1 C2 C3. Cn 주제분석 및 주요 개념 추출단계 코드와 단계 색인단계 문헌 D T1 T2 T3. Tn 색인어휘 V

색인개념의 특정성 비교 c s1 s2 k1 k2 k3 k4 c1 c2 c3 c4 분류시스템 주제명 시스템 정보자료 키워드시스템

자 동 색 인자 동 색 인 주제어나 핵심어를 컴퓨터를 이용하여 자동으로 찾아 내는 것. 색인자, 즉 인간이 작성한 것과 같은 색인을 만든다 종류 1. 통계적인 기법 2. 언어학적 기법.

Luhn 의 빈도에 따른 자동색인 분별력 있는 중요단어 빈도수 순서의 단어 단어의 빈도수 상한선 하한선 중요단어

자동색인기법의 분류 색인의 종류 구 현장 점단 점 통계적 기법 단어의 빈도계 산. 불용어제거 구현이 간단 정확도가 떨어 짐. 한국어에는 적용이 어려움 형태소해 석을 이용 한 기법 단어의 형태 소 해석 빈도수 계산 구현이간단. 한국어에 적용가 능 정확도가 떨어짐 구단위의 추출이 어 려움 구문을 이용한 기법 단어의 형태소해석 구문해석 특정 의미구를 선택 정확한 색인어 추출. 구단위의 색인어 추출 단어, 해석 결과 의 애매성 구문해석기구 구 현이 복잡 의미해석 을 이용 한 기법 문장의 완전한 이해 가장 정확한 색인 추출 현실적으로각종 사 전의 구성과 문장의 완전한 이해 불가능

색인을 위한 사전 및 정보 1. 명사 및 좌우 접속 정보 2. 복합 명사 사전 3. 기능어 사전 4. 불용어 사전 5. 전거어 사전 6. 유사어 사전

한국어를 위한 격문법 단문내에서 서술어가 지배하는 명사구들의 역할을 분 석하기위한 문법체계 격문법의 논리구조 1.Sentence Modality Proposition 2. 법 : 시제, 부정, … ( 보조용언에 의해 표현됨 ) 3. 명제 : 서술어 + 격 1+ 격 격 n 4. 격 : 격 판별자 + 명사구 5. 격 판별자 : 격조사 ( 보조 조사 포함 ) 6. 서술어 : 동사, 형용사, 서술격조사 단문법명제

한국어 색인을 위한 격과 격률의 설정 기본 문형에 자주 출현하는 15 가지 격 AGT: 행위자 INS: 도구 REA: 원인 BEN: 수익자 EXP: 경험자 OBJ: 대상 ELM: 요소 FCS: 초점 GOA: 목표 LOC: 장소 MEA: 수단 PRT: 비교 SOR: 출발 TAR: 종착 DUP: 유사목적

전자사전의 요구사항 형태소 해석기의 사전 검색형태를 유지하여 빠른 검색속도를 제공해야 한다. 사전의 색인 구조를 포함한 많은 부분이 주기억 장치내에 상주해야하고 적은 양의 주기억장치를 차지해야 한다. 시스템의 초기화 시 사전 색인 구조를 주기억 장 치로 읽는 시간이 짧아야 한다. 사전 엔트리의 수정시 검색과 동시에 삽입 삭제 가능하여야 한다.

HSPELL 의 사전구조 학 학교 학생 학원 학원장 학장 … ㄱ.. ㅅ ㅇ ㅈ.. ㅎ. ㅏ … ㅣ 텍스트사전 학 ㄱ.. ㅛ.. ㅣ …ㅐ……ㅐ… …눠……눠… ㅏ …ㅇ……ㅇ……ㄴ……ㄴ….. ㅇ ㅈ ㅏ…ㅏ….. ㅇ 주기억장치에 로딩된 사전

DACOHSE 의 사전구조 학 학교 학생 학원 학원장 학장 … 학 학교 학생 학원 학원장 학장 ….…. 파일에 구현된 사전 메모리에 코드된 사전화일정보 A. 텍스트사전 B. 구현된 사전 색인 구조

BTI 의 사전구조 학 학교 학생 학원 학원장 학장 … … … … 교 생 원 장 장 학 자식 포인터 접속 정보 테이블 주기억장치 A. 텍스트사전 B. 저장상태 ㈜ : 형제포인터