Machine Learning Network Data Science Lab Seunghun Lee, KangHee Lee

Slides:



Advertisements
Similar presentations
SPEAKER VERIFICATION SYSTEMS 대화형 사용자 인터페이스 개론 정보와 추론 연구실.
Advertisements

텍스트 마이닝을 활용한 신문사에 따른 내용 및 논조 차이점 분석 연세대학교 문헌정보학과 송민
2012 Knowledge Service Engineering Knowledge Service Engineering.
Big Data & Hadoop. 1. Data Type by Sectors Expected Value using Big Data.
인공지능 소개 부산대학교 인공지능연구실. 인공 + 지능 인공지능이란 ? 2.
1 ‘ 우리나라의 주요공업 ’ - 정도웅, 주민혁, 안수진, 백경민, 엄다운, 박경찬 -.
Dept. Computer Engineering DBLAB 정보처리개론 담당 교수 : 김정석 2009 년도 1 학기.
Association Rule Sequential Pattern Classification Clustering Data Mining A B C D 2.
Android 프로그램개발 환경. 학습 목표 ■ 교육 목표  JDK 설치  JDK 환경 설정  Eclipse 설치  Android SDK 설치  ADT Plug-in 설치  Android Virtual Device(AVD) 설치  Android 예제 프로그램.
What Opinion mining? Abstract 이 논문에서는... 1.Different granularity levels (word, sentence, document) 2. Discussion about terms of challenges 3. Discussion.
Kim Jun Woo 지식정보처리및응용 1 지식정보처리 및 응용 09. 데이터마이닝 기법과 응용 동아대학교 산업경영공학과 김 준 우.
연관규칙기법과 분류모형을 결합한 상품 추천 시스템:
목 차 C# 언어 특징 .NET 프레임워크 C# 콘솔 프로그램 C# 윈도우 프로그램 실습 프로그래밍세미나 2.
MS SQL Server 학기, 소프트웨어 설계 및 실험 ( Ⅰ )
Machine Learning to Deep Learning_2
공부할 내용 조상들이 살던 곳 자연과 잘 어울리는 한옥 지방에 따라 서로 다른 집의 모양 섬 지방의 집
사랑, 데이트와 성적 자율성 :데이트 성폭력!!! 성폭력예방교육 전문강사 / 여성학 전공 신 순 옥.
퇴계와 율곡의 사회사상 비교 남 일 재 동서대학교 교수/ 정치학 박사 1. 퇴계 이황과 율곡 이이의 약전(略傳)
(Classification – Advanced Techniques)
501. 군인들의 세상 502. 민정 이양과 한일회담 이선용.
Java Development Environment & Eclipse IDE
제 09 장 데이터베이스와 MySQL 학기 인터넷비즈니스과 강 환수 교수.
Information Technology
Hybrid INDIGO project 중간보고
Building-Find Argument Reality
데이터마이닝의 소개 Data Mining Introduction
OpenCV 이미지 객체 추출.
데이터 마이닝 - 강의 개요 년 가을학기 강원대학교 컴퓨터과학전공 문양세.
Lab Assignment 2 Neural Network & Ensemble Data Mining 2016 Fall 1 1.
SSAS 변화된 구조와 사용자 분석 화면 구현 우철웅 기술이사 BI 사업부 인브레인.
Python Network Data Science Lab Seunghun Lee, KangHee Lee
Communication and Information Systems Lab. 황재철
ServerGuide CD를 이용한 xSeries 설치가이드
컴퓨터과학 전공탐색 배상원.
머신 러닝 2 ㈜ 퀀트랩.
학습목표 학습목차 다른 홈페이지의 HTML 파일 코드를 보는 방법에 대해 알아봅니다.
You YoungSEok Oracle 설치 You YoungSEok
2014년 가을학기 손시운 지도 교수: 문양세 교수님 군집 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
Lab Assignment 3 Deep Learning 1 1.
소프트웨어시스템실습 3강: R 프로그래밍 및 데이터 조작
Data Mining Final Project
(Data Exploration & Analysis)
정보 추출기술 (Data Mining Techniques ) : An Overview
2장. 데이터베이스 관리 시스템 데이터베이스 관리 시스템의 등장 배경 데이터베이스 관리 시스템의 정의
Lecture 0 Overview Hong, You Pyo, DGU.
2014년 가을학기 손시운 지도 교수: 문양세 교수님 분류 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
세종학당(King Sejong Institute) – Free Korean Language Class
Endnote 이용 안내 2010 중 앙 도 서 관.
정치개혁의 가능성 논의 권력구조 개편을 통하여 본 -개헌을 통한 정부형태의 변화를 중심으로 [한국정치론] 윤성이 교수님
MovieStory 작성자 홍성혁 소속 전자전기컴퓨터공학부 학번
Machine Learning using Neural Networks
데이터마이닝, 빅데이터, 데이터과학: 정의 데이터마이닝(data mining)
데이터 마이닝 - 강의 개요 년 가을학기 강원대학교 컴퓨터과학전공 문양세.
운영체제의 종류 장승빈.
Ⅶ. 명함관리 1. 초기 화면 설명 2. 명함 분류 관리 3. 명함 이동,공유,복사 4. 명함 등록, 수정 5. 상세검색 6.
Challenging Issues 다양한 형태로 흩어져 있는 데이터를 어떻게 모으고 관리할 것 인가?
알고리즘 알고리즘이란 무엇인가?.
노년기 발달 장안대 행정법률과 세류반 정 오 손
Professor: Dongman Lee
태국 문학 욜라다 왓짜니 싸란차나 팟차라와라이 끼따야펀 르앙다우 타니다.
1. 관계 데이터 모델 (1) 관계 데이터 모델 정의 ① 논리적인 데이터 모델에서 데이터간의 관계를 기본키(primary key) 와 이를 참조하는 외래키(foreign key)로 표현하는 데이터 모델 ② 개체 집합에 대한 속성 관계를 표현하기 위해 개체를 테이블(table)
그래픽스 및 웹 응용 설계 학번: 학과: 멀티미디어학과 이름: 문 동 민.
멀티미디어시스템 제 4 장. 멀티미디어 데이터베이스 정보환경 IT응용시스템공학과 김 형 진 교수.
1. 입력 데이터 ② 대학, 학과: 대학이 존재하지 않을 경우 학과명을 대학에 입력 학과명은 공백으로 유지 (하단 참조)
Templete for you!
1. 데이터베이스 환경.
워밍업 실뭉치 전달게임.
적용 가능 시간표 무한 생성 기계 2007/06/18 최석훈.
음파성명학 최종욱.
Progress Seminar 선석규.
Presentation transcript:

Machine Learning Network Data Science Lab Seunghun Lee, KangHee Lee Professor : Hyun-Chul Kim 2018. 05. 14

수업 참고 자료 데이터 마이닝 Data Mining - 데이터 속 숨은 의미를 찾는 기계 학습의 이론과 응용 II부 고급 데이터 마이닝 알고리즘 III부 웨카 데이터 마이닝 워크벤치 Three online courses on data mining with Weka - Data Mining with weka, More Data Mining with Weka, Advanced Data Mining with Weka. - https://www.cs.waikato.ac.nz/ml/weka/documentation.html 2/28

목차 Weka 입문 - What is Weka? - Installation Weka 사용 - 데이터 준비 Weka를 이용한 예제 데이터 분석 - Feature Selection - Classification - Clustering 3/28

Weka 입문 (설치하기) 4/28

What is Weka? Collection of machine learning algorithms for data mining tasks - pre-processing - classification - regression - clustering - association rules - visualization Weka(Waikato Environment for Knowledge Analysis) - 뉴질랜드에만 서식하는 날지 못하는 호기심 많은 새 - 뉴질랜드의 Waikato 대학에서 개발 Support Multiple Platforms - Windows, Mac, Linux 5/28

How many algorithms? 100+ algorithms for classification 75 for data preprocessing 25 to assist with feature selection 20 for clustering, finding association rules, etc - Since 2014 - 6/28

Weka 설치 Website: - https://www.cs.waikato.ac.nz/ml/weka - 32bit : https://drive.google.com/file/d/11CX_QITAZa8EVb_bFbZ__yXRQAemit- f/view?usp=sharing - 64bit : https://drive.google.com/file/d/1MR9ThE1i7VxoRk5R__jQg8Z7XyPb1SkI/view?usp=shari ng Java JDK : Weka는 JAVA VM 위에서 동작하기때문에 설치 - http://www.oracle.com/technetwork/java/javase/downloads/index.html 7/28

Weka GUI Explorer - 기본적인 GUI Interface - 모든 내장된 기능 사용 가능 Experimenter - 다양한 학습 기법들을 한꺼번에 비교 분석 가능 - 데이터 셋과 알고리즘의 비교 분석 설계 가능 Knowledge Flow - 입력된 데이터를 처리하기 위한 환경 제공 - 대규모 데이터 처리 가능 Workbench - Explorer + Experimenter SimpleCLI - Command Line Interface 8/28

Weka 사용 9/28

Explorer 10/28

Explorer 다양한 포맷의 데이터 파일들 사용 가능. - ARFF, CSV, C4.5, binary URL 이나 SQL 데이터베이스(JDBC)로 읽기도 가능. WEKA의 전처리 도구를 “filters”라고 부름. WEKA의 filters - Discretization, normalization, resampling, attribute selection, combining attributes, … 11/28

ARFF data Nominal attribute Numeric attribute Relation name “weather” 5 attribute information 1. outlook 2. temperature 3. humidity 4. windy 5. play (class) Data 12/28

13/28

14/28

15/28

Weka를 이용한 예제 데이터 분석 16/28

Data Format: IRIS @RELATION iris @ATTRIBUTE sepallength REAL @ATTRIBUTE sepalwidth REAL @ATTRIBUTE petallength REAL @ATTRIBUTE petalwidth REAL @ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-virginica} @DATA 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa Etc. General from @atttribute attribute-name REAL or list of values 17/28

Classify 18/28

Classify 19/28

Classify 20/28

Clustering Iris.arff 데이터 사용 21/28

Associate 연관 규칙 찾기 Supermarket.arff 데이터 사용 22/28

23/28

Select attributes Class를 분류하는데 Feature들이 유용한지 유용하지 아닌지 확 인하는 과정 24/28

Visualize 25/28

다음시간에는??? Movie review 데이터를 수집(평점과 글) https://textblob.readthedocs.io/en/dev/classifiers.html - Textblob 툴을 활용, Naviebayes Classifier을 이용해서 수집한 Review 데이터로 모델 학습 수집한 글과 글의 각 평점을 바탕으로 평점 분류 예측기 만들기 만들어진 분류기로 직접 영화에 대한 사람들의 의견 평가해보기 - Twitter에서 영화 제목을 키워드로 트윗 수집 후 분류기로 평점 분석 26/28

숙제 Rotten Tomatoes 에서 영화 리뷰 모두 수집해 서 텍스트 파일 형태로 저장 - [작성자, 글 내용] 형태로 저장 Twitter 에서 영화를 키워드로 트윗 최소 천개 이상 수집해서 텍스트 파일 형태로 저장 - [작성자, 트윗 내용] 형태로 저장 27/28

Thank you!!! 28/28