전공 : 컴퓨터 공학 전공 과목 : 인터넷 정보 검색 학번 : 2002036274, 2003053429 이름 : 조 항 두, 오 철 원 발표일 : 08.05.29.

Slides:



Advertisements
Similar presentations
자기소개서 만들기. 2 4) 자기소개서 작성방법 [ 데이터 수집 ] - 지원하는 업무는 어떤 업무인가 ? - 그 일을 왜 하고 싶은가 ? - 그 업무는 나의 전공과 관련이 있는 업무인가 ? - 그 업무를 수행하기 위해 미리 알아야 할 사항은 무엇인가 ? - 필요한 직무능력을.
Advertisements

전공 : 컴퓨터 공학 전공 과목 : 인터넷 정보 검색 학번 : , 이름 : 조 항 두, 오 철 원.
데이터마이닝 & 정보검색 연구실 신 현 일.  검색 시스템에 필요한 요소  인터넷 검색의 유형 / 태그란 ?  Blog 검색 시스템 설계  Target : Blog ? / 국내 Blog 사이트 분류  Collection : 어디서 무엇을 추출할 것인가 ? 
작성자조성웅 작성일자 기본환경 1. Java : Eclipse : Tomcat : 6.0 이상 4. DB : MySQL File System : DFS 6. Framework - Spring : JPA 및 CXF.
텍스트 마이닝을 활용한 신문사에 따른 내용 및 논조 차이점 분석 연세대학교 문헌정보학과 송민
2 Ⅰ 2016 수출연계형 기술사업화 프로그 램 사업설명회 3 4 구 분지원분야비고 시각디자인 외국어 종이 카탈로그, 외국어 포장디자인 멀티미디어 외국어 전자 카탈로그, 외국어 동영상, 외국어 모바일용 앱, 외국어 홈페이지 디자인 제품디자인 종합디자인 해당분야 모든.
’ 전자세금계산서 도입 CONTENTS 1. 부가가치세법 개정내용 2. 전자세금계산서 개요 및 발행 방법 3. 이지메디컴 전자세금계산서 발행 Process.
MO/MT를 활용한 Call Center 제안
영상 광고사업 추진계획 2010 ㈜ 지오피스
새주소 안내시스템 구축방안 지오윈(주) 박 인 철
프랜차이즈 본사 인트라넷 구축 제안서 제출처 : ㈜마세다린 제출사 : ㈜데이타캠프 제출일 :
2011년 봄학기 정보컴퓨터공학부 컴퓨터 소프트웨어 설계 및 실험
통합연구사업지원 정산 사용자 설명서 (기관사용자).
社 內 限 LGE ISG 준수반영 확인서 정보전략팀.
웹 해킹 기초와 실습.
웹사이트 구축 제안서 (결혼정보 사이트구축) First Web Agency.
Google Analytics Seminar
조선일보 아카이브 Chosun Archive archive.chosun.com
Information Retrieval (Chapter 4: 질의언어)
1 PROJECT TITLE 기획 PAGE NO. 웹 페이지 구성 화 면 번호 화 면 설 명 연 결 화 면 L1 L4 L7
ASP 정 보 보 호 학 과 양 계 탁.
김은지 강남대학교.
(PROJECT명: Web Server관리)
독도 바로알기 2. 사료와 지도로 보는 독도.
'경영평가정보시스템 구축' 경영평가단 설명회
SEO 마케팅 서비스 제안서.
자격증 모의 테스트 시스템 담당 교수 : 이 상 문 교수님 팀명 : CSCLAB
제 7 장 원격교육의 개발 기술 7주 2강.
HTML5+CSS3 실무 테크닉 김은기 저.
플로우 차트 (FC : Flow Chart) 플로우 차트(Flow Chart)란 웹사이트를 접속하여 어떠한 플로우를 거쳐서 네비게이션하는가를 나타내는 것입니다. 그리고 전체적인 사이트의 흐름도를 도식적으로 표현한 설계기법중의 하나입니다.   개발자들이 자신의 개발 스타일이.
1강_web과 html Web이란? HTML이란? CSS란? Lecturer Kim Myoung-Ho Nickname 블스
제주닷컴 매뉴얼 (실시간 예약시스템) 2013년 10월.
책꽂이 KDC 제안서 PHOSE 꼭 읽어 보세요. 많은 도움이 될 것 입니다.
제 1 장 소 개 시스템 분석 및 설계 허철회 2006학년도 2학기 상주대학교 컴퓨터공학과.
낮과 밤 알아보기 슬기로운 생활 2학년 1학기 4. 빛과 그림자>낮과 밤( 4/8 )
상용 DBMS에서 사용하는 다차원색인 컴퓨터과학과 이돈규 상용 DBMS에서의 다차원색인.
[ 도면뷰잉 관련 인터넷 옵션 설정 확인 및 변경 ]
파피루스 사이트 웹기획서.
Web Vulnerabilities 정보 보호 2008/05/31 Getroot.
초등교원 전보시스템 사용자 설명서(교감, 원감용) 광주광역시교육청.
Database 중고차 매매 DB 비즈니스IT 윤동섭.
Nature EBSCO Korea.
Web RSS 서비스 구축 조이름 : A 도상훈 김진범 정도영 공정호.
PNAS (Proceedings of National Academy of Science)
Cyber Shopping Mall 구축 - CD New - 안소연,박지윤,박종봉,정영은.
XSS (Cross Site Script)
한국산업기술평가원 사업비카드제안내 (산업기술기반조성사업)
myfood.com 상명대 맛집 홈페이지 구축 제안서
통합연구사업지원 정산 사용자 설명서 (연구책임자).
바이러스와 악성코드.
플로우 차트 (FC : Flow Chart) 플로우 차트(Flow Chart)란 웹사이트를 접속하여 어떠한 플로우를 거쳐서 네비게이션하는가를 나타내는 것입니다. 그리고 전체적인 사이트의 흐름도를 도식적으로 표현한 설계기법중의 하나입니다.   개발자들이 자신의 개발 스타일이.
사업계획서.
Ⅳ. 생식과 발생 4. 자손에게 줄 세포 만들기.
“병원 폐기물 소각장” 및 “가축 폐수 처리장” 건축 허가 반대 (2011년 “음식물처리장” 미해결 민원 연관)
광고센터 완전정복 매뉴얼 ( ).
전자정보 통합검색(Meta Search ) 이용 안내
제1회 PNU 코딩경진대회 부산대학교 소프트웨어교육센터.
Oracle 구성 Internet Application Server Database Server.
Project Muse 이용자 매뉴얼 Last updated : Dec, 2013.
Module명 : 물품구매/공사구매/입찰
HTML HTML 기본 구조와 태그 다양한 태그 다루기
▶서류관리 프로그램 1. 로그인….2 2. 서류등록 … 서류도착 서류스티커발행
자료구조 강의소개 정성훈 연락처 : 이메일 : 연구실 : 연219호 연락처 : 이메일 : 홈페이지: 정성훈.
“전자구매” 메뉴 접속을 위해 “전자입찰” 메뉴에서 공인인증서 등록
검색엔진의 이해 정보사회와 컴퓨터- 팀프로젝트 황연옥 최은숙 이한아
코 칭 결 과 센 터 구성센터 (모바일) 코칭대상 프로 (엔지니어) 코칭일시
1. 칭찬 및 고발제도 운영(안) 1. 목적 : 칭찬문화의 전사적 확산,전파를 통한 칭찬문화 조성 및 건전한 회사문화 형성
한국디지털미디어 고등학교 번 조성혁 HTML 5는 HTML4의 다음 버전으로 특정 plug-in같은 것 없이 web에서 진보,발전된 application을 만들 수 있도록 HTML을 발전시킨 것이다.
차세대 응급의료정보망 구축 4차 사업 통합로그인 이용메뉴얼 v1.1.
중등교원 전보시스템 사용자 설명서 * 작성일 2018 년 12 월 14 일 * 작성자 광주광역시교육청.
Presentation transcript:

전공 : 컴퓨터 공학 전공 과목 : 인터넷 정보 검색 학번 : , 이름 : 조 항 두, 오 철 원 발표일 :

1. 개요 2. 변경사항 3. 시스템 구상도 4. 진행사항 5. 기타 6. 결과물

 인터넷 정보검색 수업의 프로젝트로 검색 엔진 제작  초기 차량 정보 검색을 위한 제한적인 검색 엔진을 구현  현재 진행사항과 결과물

Crawler Process Engine Car Information Database Car Information Database Search Web Site Search Web Site Word ID Table

 crawler 구현  Crawler 는 python 으로 제작  한글 형태소를 분석하기 위해 KLT: Korean Language Technology 사용 ▪ 출처

 Process engine 구현  Process engine 은 python 으로 제작  Word id 부여 및 url, pre context 추출  Word id 와 data record 를 Database 에 기록

 Database  MySQL 을 사용하여 구축  Word-ids, url, precontext 를 구성으로 함  Fulltext search 를 이용함

 Web site 구축  Pyframe 으로 구축  구글 검색 형태와 유사한 디자인  Page 이동 기능

 Web site 구축  FullText Search 로 keyword 를 검색 ▪ Word 를 id 화 하여 한글 아닌 숫자로 fulltext 검색 가능  Cosine 비교 방법을 사용하여 질의와 문헌 비교

 애로사항 ▪ Cosine 처리 방법은 질의와 문헌과의 관계를 표 시하지만 1 개의 질의 시 비교는 등장이 100% 로 일치한다. ▪ 질의 내 단어의 비중은 1, 문헌 내 해당 단어에 대한 비 중은 상대적으로 등장만 하면 100% 이다 ▪ 데이터를 가져오는 웹사이트 내 java script 의 과 다 등장으로 인한 불필요한 text 등장 ▪ 순수 html 로 작성된 페이지는 형태소분석이 효과적임

 애로사항 ▪ 불필요한 데이터로 인한 pre context 추출 및 검 색 title 추출이 모호함 ▪ Title 을 추출하는 방법도 동일사이트의 경우 분별력을 가지지 못함 ▪ 자바스크립트가 많은 경우 text 의 앞 대부분은 html 과 주소들이 노출되어 사용이 불가. ▪ 포털사이트 기사링크 제목에 의해 불필요한 페 이지와 질의가 일치

감사합니다.