IS lab. 김건영 http://hagazzusa.github.io/ TF-IDF IS lab. 김건영 http://hagazzusa.github.io/

Slides:



Advertisements
Similar presentations
1/29 키보드로 직접 입력할 수 없는 다양한 기호와 한자를 입력하는 방법을 알아 보자. 또한 블록으로 영역을 설정하는 여러 가지 방법에 대해 살펴본 후 블록 으로 설정된 내용을 복사하여 붙여넣거나, 잘라내고 이동하는 방법에 대해서 도 알아보자. 02_ 문서의 입력과 편집.
Advertisements

LOGO Open API 를 이용한 SNS 위젯 개발 프로젝트 최종 발표 4 조 채상혁 윤호선 이재규.
농촌인적자원개발센터 홈페이지 회원가입 방법. 회원가입 1. 농촌인적자원개발센터 홈페이지 ( 포탈사이트 ( 구글, 네이버 다음 등 ) 농촌인적자원개발센터 검색 ★ 홈페이지 접속 - 회원가입 버튼 클릭.
목차 Contents 무선인터넷용 비밀번호 설정방법 Windows 7 Windows 8 Windows XP MAC OS.
기초C언어 제1주 실습 강의 소개, C언어 개요, Cygwin/Eclipse 사용 컴퓨터시뮬레이션학과 2016년 봄학기
컴퓨터프로그래밍 1주차실습자료 Visual Studio 2005 사용법 익히기.
Image & Video processing
코크파트너 설치 가이드 Window 7.
KETS International Lounge 상담예약 방법
ERP 전용 브라우저 설치 매뉴얼 (Windows 7)
Outlook Express 메일 백업 및 복원가이드
Ch. 1 LINUX SYSTEM.
ANSYS17.2 Student 제품 무료 다운로드
나민영 서경대학교 컴퓨터공학과 CGVR Lab 같이만들어보자 5주차 OpenCV 설정 및 기초.
임베디드 시스템 개론 크로스 플랫폼 설치 2일차 강의 자료 Embedded System Lab.
홍익대학교 메일 시스템 구축 Outlook 설정 매뉴얼.
[ ] 호서대학교 현장실습지원센터 홈페이지 안내 교수 매뉴얼.
4-1장. MySQL 제13장.
DB를 이용한 정보검색기 구현 (sqlite3)
Root Filesystem Porting
1. C++ 시작하기.
제 2 장 WML 시뮬레이터 및 무선인터넷 서버 설치
Root Filesystem Porting
소프트웨어 분석과 설계 Struts2 & JBOSS 설치하기
Homework #5 (1/3) 다음을 수행한 후, 결과 파일들을 출력하여 제출한다.
SSL-VPN 설치 및 접속 설명서.
학습목표 학습목차 다른 홈페이지의 HTML 파일 코드를 보는 방법에 대해 알아봅니다.
TF-IDF Porter stemmer, AP-88데이터셋
Q. 방법#1을 해봐도 실행이 안될 때? Q. 점검 항목이 존재하지 않는다고 할 때?
CHAP 13. 방명록 만들기 실습.
시스템 인터페이스 Lab3 Unix 사용법 실습.
2015학년도 PHP 기말 레포트 로그인 홈페이지 제작.
이메일 자동 포워딩 방법 (Outlook/OWA)
홀인원2.0 설치 메뉴얼.
1. SSLVPN 접속 방법 Internet Explorer 실행(타 브라우저 사용 불가)
IPython Notebook + Spark + TensorFlow on MacOS
영상처리 실습 인공지능연구실.
홍익대학교 메일 시스템 구축 그룹웨어 메일 이전 하기.
ERP 전용 브라우저 설치 매뉴얼 (Windows 7)
Nessus 4 설치 정보보호응용 조용준.
1차시: 낮과 밤이 생기는 원리 지구과학
컴퓨터 프로그래밍 기초 - 8th : 함수와 변수 / 배열 -
1. 인증서버 :일반유선PC( 접속“CA관리” 클릭
1. 스크립트 작성 마법사 2. NSIS 스크립트 컴파일
컴퓨터 개론 및 실습 1주차 2015년 03월 05일.
PMIS 서버 설정 환경설정 작성자 : 배경환.
빌드 성공.
S-Work 2.0 DRM 신규 버전 설치 가이드 SOFTCAMP
OpenCV 설정 2.21 만든이 딩딩.
시스템 인터페이스 Lab#5 쉡 실습.
Homework #5 (1/3) 다음을 수행한 후, 결과 파일들을 출력하여 제출한다.
Tensorboard in Windows
JSP Programming with a Workbook
기초C언어 제2주 실습 프로그래밍의 개념, 프로그램 작성 과정 컴퓨터시뮬레이션학과 2016년 봄학기 담당교수 : 이형원
시스템 인터페이스 Lab1 X-window 및 명령어 사용.
Homework #3 (1/3) 다음을 수행한 후, 결과 파일들을 출력하여 제출한다.
함수, 모듈.
1. 인터넷 보안 옵션 레지스트리 등록 Config Setup 클릭.
슬라이드 쇼의 설정 슬라이드 쇼의 실행 파일과 폴더의 관리 글꼴을 포함해서 저장 웹 페이지로 게시 압축 파일
무선랜 사용자 설명서 (Windows Vista 사용자).
Mr. Software engineering Project group 9.
접근제어 솔루션 계정등록 및 클라이언트 설치.
FTP 스캔 설정 방법 강사 : 이성휘 대리.
어드민 로그인 ID : admin 비밀번호 : 서보테크 1. 제품소개 등록 - MISUBISHI
대한축구협회 대한축구협회 2013년 전산등록 매뉴얼 2018년 심판보고서매뉴얼.
숙제 작성 및 제출 과정 김진하 2008/03/14.
Docker Study 6~7.
이 프레젠테이션은 PowerPoint의 새로운 기능에 대해 안내하며, 슬라이드 쇼에서 가장 잘 보입니다
Chapter 11. 문서 인쇄 및 파일 형식.
SPL-Duino 블록 편집기 이용하기 전류센서 블록 만들기 SPL-Duino 블록 편집기를 실행합니다.
Presentation transcript:

IS lab. 김건영 http://hagazzusa.github.io/ TF-IDF IS lab. 김건영 http://hagazzusa.github.io/

들어가기에 앞서 CS1 서버에서 컴퓨팅을 하되 GUI환경의 파일탐색과 편 집기 사용을 위한 환경세팅 https://winscp.net/eng/download.php 들어가서 Download WinSCP 클릭 [파일탐색기] 편집기는 아무거나 (윈도우 기본 메모장, winscp내장 메 모장, Notepad++, VS code 등) 원하는 거 쓰기

WinSCP - 1 New Site를 클릭하고 Host name에 cs1서버를 적는다. 아래 Save버튼을 클릭하면 왼쪽에 저장이된다.

WinSCP - 2 아이디와 비밀번호를 적어 들어간다. Password아래 Remember .. 체크시 이번 세션에 한해서 비밀 번호를 저장한다. (접속종료시 유지되지 않음)

WinSCP - 3 왼쪽에는 로컬 디렉토리가 오른쪽에는 원격 서버의 디렉 토리 구조가 표시된다.

WinSCP - 4 파일을 더블 클릭시 winscp에 설정된 편집기로 열린다. 별다른 설정이 없다면 winscp내부 편집기를 사용하여 열므로 설정해줘야 한다. –기본 편집기 사용 추천 X-

WinSCP - 5 Add버튼으로 원하는 편집기를 추가하고 Up을 이용하 여 1순위로 올리면 원하는 편집기로 바로 열 수 있다.

WinSCP - 6 위와 같이 임시폴더를 이용하여 임시파일이 생성되고 임 시파일에 변화가 있다면 WinSCP가 변화를 알아채어 본 래 파일(원격 서버쪽)을 임시파일로 대체한다. 새파일 추가

WinSCP - 7 WinSCP를 이용하여 python 실행해보기 test.py란 이름의 스크립트파일 생성 후 편집기에서 저장 (Remember password … 비체크 시 저장할 때마다 인증 팝업이 뜬다.) 쉘에서 python test.py 입력 시 헬로우 월드 출력

오늘 할거 Awk로 포스팅 리스트 만들기 Python으로 포스팅 리스트 읽기 Tf-idf 구현 오늘도 출석은 과제제출로 대신합니다. 과제 제출 정보 는 맨 마지막 페이지에 있습니다.

Awk를 이용한 posting list 작성 저번에 했던 예제에 문서별 tf 추가

Awk를 이용한 posting list 작성 다음과 같이 문서이름 뒤에 #이 붙고 단어가 해당 문서 에서 몇 번이나 등장했는지 보여줌 위 출력을 post.list 로 redirection

TF-IDF 클래스 만들기 Class TF_IDF 생성자: post.list파일 읽어서 파이썬 사전 형태로 만듬 word_tf(term, doc): doc에 있는 term의 term frequency를 계산하여 리턴 word_idf(term): term의 inverse document frequency를 계산하여 리턴 calc_sent_tfidf(sentence): 들어온 query인 sentence 의 tf-idf를 계산하여 리턴 print_sorted_tfidf(sentence): calc_sent_tfidf의 결과를 출력해줌 디렉토리 구조->

TF-IDF 클래스 만들기 1

TF-IDF 클래스 만들기 2

TF-IDF 클래스 만들기 2 위 코드를 돌리면 아래와 같은 화면 출력

과제와 제출정보 Ex) 제출 이메일 : gyk@kangwon.ac.kr 제목 양식 : [학번]tf-idf No, that would be too easy. Well, we`ll just see how he feels after I... 라는 query의 tf-idf 결과를 캡쳐하여 보내기 Ex) 제출 이메일 : gyk@kangwon.ac.kr 제목 양식 : [학번]tf-idf