2014년 가을학기 손시운 (ssw5175@kangwon.ac.kr) 지도 교수: 문양세 교수님 군집 2014년 가을학기 손시운 (ssw5175@kangwon.ac.kr) 지도 교수: 문양세 교수님.

Slides:



Advertisements
Similar presentations
10장. 시기별 학급경영 11조 염지수 이 슬 권용민 신해식.
Advertisements

일본 근세사. (1) 에도막부의 개창 ( ㄱ ) 세키가하라의 전투 (1600) - 히데요시의 사후 다섯 명의 다이로 ( 大老 ) 가운데 최대 영지 (250 만석 ) 를 보유하고 있던 도쿠가와 이에야스가 급부상. 이에 이에야스와 반목해 온 이시다 미쓰나리 ( 石田三成 ),
아니마 / 아니무스 송문주 조아라. 아니마 아니마란 ? 남성의 마음속에 있는 여성적 심리 경향이 인격화 한 것. 막연한 느낌이나 기분, 예견적인 육감, 비합리적인 것에 대 한 감수성, 개인적인 사랑의 능력, 자연에 대한 감정, 그리.
대구가톨릭대학교 체육교육과 06 학번 영안중학교 체육교사 신웅섭 반갑습니다. 반야월초등학교 축구부 대륜중학교 축구부 대륜고등학교 대구가톨릭대학교 차석 입학 대구가톨릭대학교 수석 졸업 2014 년 경북중등임용 체육 차석 합격 영안중학교 체육교사 근무 소개.
일반인 심폐소생술 과정의 필요성 대한심폐소생협회 교육위원회 이 중 의. 내용 1. 우리나라 응급의료체계의 헛점 2. 병원 - 밖 심정지의 치료 결과 3. 일반인 심폐소생술 교육 현황 4. 효과적인 심폐소생술 교육의 확대 5. PAD.
교수님 영상 제 2 장 관세법 일반 제 1 절 통칙 제 2 절 법 해석의 원칙 등 제 3 절 기한과 기간 제 4 절 서류의 송달 등 제 5 절 관세의 부과 및 징수 제 6 절 납세의무의 소멸 등.
일장 - 1 일 24 시간 중의 명기 ( 낮 ) 의 길이 ( 밤은 암기, 낮은 명기 ) 광주기성 - 하루 중 낮의 길이의 장단에 따라 식물의 꽃눈 형성이 달라지는 현상 일장이 식물의 개화현상을 조절하는 중요한 요인 단일식물 - 단일조건에서 개화가 촉진되는 식물 장일식물.
Marketing Research 1  군집분석의 개념과 적용  군집분석 (cluster analysis) : 다수의 대상들 ( 소비자, 제품, 기타 ) 을 그들이 소유하는 특 성을 토대로 유사한 대상들끼리 그룹핑하는 다변량 통계기법 → 군집내의 구성원들은 가급 적.
2 학년 6 반 1 조 고은수 구성현 권오제 김강서.  해당 언어에 본디부터 있던 말이나 그것에 기초하여 새로 만들어진 말  어떤 고장 고유의 독특한 말  Ex) 아버지, 어머니, 하늘, 땅.
2014년도 교원 및 기간제교사 성과상여금 전달교육 개 회 국기에 대한 경례 - 인사말
해외진출기업을 위한 중동부유럽(4개국) 투자가이드.
유럽: 어디에서 어디로? 2006년 3월 9일 서대문CBMC강연 서강대학교 이규영 교수.
May, 2000.
이 주호 KDI School of Public Policy and Management
선진 고양교육 “유아교육 행정 업무 연수” 유치원 회계실무 및 유아학비 연수 경기도고양교육청.
중국의료용 로봇 연구제조와 임상응용현황 북경천지항의료과학기술주식유한공사 장송근 박사 교수급 고급엔지니어 2015년7월9일
Amway show the plan 꿈의 사업 Business.
묵자 겸애, 비명, 비공, 상현, 상동, 천지, 명귀, 삼표 법.
국제관계의 이해(11) 신 유럽의 등장과 European Union
내 아이를 위한 구강관리.
14주차 1교시 강화계획 [학습목표] 1. 강화계획의 정의를 안다 [학습내용] 1. 단순한 강화계획 2. 간헐적 강화 3. 복합 계획 4. 선택과 대응법칙 [사전학습] 강화계획이 일어날 수 있는 사례를 생각해본다.
원가와 구매관리 원가의 이해 식자재 구매과정 검수절차 식음자재 확인 반품 보고서 작성 검수관리 입고관리 출고관리 재고관리
제16장 원무통계 • 분석 ☞ 통계란 특정의 사실을 일정한 기준에 의하여 숫자로 표시한 것을 말한다.통계로서 활용할 수 있는 조건으로는 ① 동질성을 지녀야 하고 ② 기준이 명확하고 ③ 계속성이 지속되어야 하며 ④ 숫자로 표시하여야 한다 경영실적의.
ING 파워공모주사모증권투자신탁 (주식혼합)
2014년 가을학기 손시운 지도 교수: 문양세 교수님 연관 규칙 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
데이터 마이닝을 이용한 분류 분석.
서울지방세무사회 부가세 교육 사진클릭-자료 다운 세무사 김재우.
치매의 예방 김 은민 윤금 노인요양원 치매의.
세계화를 위한 조직관리 Organization for Globalization
Machine Learning Network Data Science Lab Seunghun Lee, KangHee Lee
1주차 세계금융시장의 환경/국제통화제도 (Ch. 1+2).
패전후 일본의 욕망과 소비 욕망자연주의 이길 때까지는 원하지 않는다 사치는 적이다에서 사치는 훌륭하다로 패전 후의 궁핍생활
Nguyễn Hữu Nam Trưởng phòng Pháp chế, VCCI-HCM
Customise  Search  Communicate  Target
영상 복원 7.1 영상의 열화 모델 7.2 잡음 모델 7.3 공간 영역 필터를 통한 잡음 제거
Lab Assignment 2 Neural Network & Ensemble Data Mining 2016 Fall 1 1.
European Union & Brexit
군집분석: 비지도 학습 효율적 군집분석 급내 (intra-class) 유사성이 높고
Work-Life Balance (WLB) 프로그램의 이론과 실제
Cluster Analysis (군집 분석)
머신 러닝 2 ㈜ 퀀트랩.
2014 GDP per capita 54,678 USD 독일 47,200 USD 영국 44,141 USD 28,738 USD
마산에 대하여 만든이 : 2204 김신우, 2202 권성헌.
군집 분석 (Cluster Analysis) 2016년 가을학기 강원대학교 컴퓨터과학전공 문양세.
김 병 구 글로벌 매너(1) 코스 소개 및 언어 구조 김 병 구
Lab Assignment 3 Deep Learning 1 1.
소프트웨어시스템실습 3강: R 프로그래밍 및 데이터 조작
동작인식을 이용한 재활훈련 시스템 콘텐츠서비스연구팀 최완.
소프트웨어시스템실습 4강: 데이터 시각화 (그래프)
UKRAINE MONGOL 확장된 영역 RUSSIA Moscow.
군집분석 (Cluster analysis)
(Data Exploration & Analysis)
시험검사분야 인정제도의 국제적 동향 및 국가발전을 위한 인정정책 방향
2014년 가을학기 손시운 지도 교수: 문양세 교수님 분류 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
과거사 청산, 밝은 미래를 위하여 역사 청산 비교 분석-독일과 우리나라.
소프트웨어시스템 실습 머신러닝(2) 학기.
KPMG 2002 Fraud Survey (국내 진출 외국계 기업 중심의 연구)
Machine Learning using Neural Networks
한국 개화기의 어휘 한국어 어휘와 표현
세계인구변화의 영향 존 파커 이코노미스트 세계화 담당 편집자.
정보처리학회논문지 B 제10-B권 제1호(2003.2) 김만선, 이상용
6장 마케팅 조사 박소현, 김중호, 박기찬.
한밭대학교 창업경영대학원 회계정보학과 장 광 식
기본 테이블세팅(로맨틱) 푸드스타일리스트 전공 김선아.
음양오행과 물리학 조 원 : 김용훈, 양범길, 박수진, 윤진희, 이경남, 박미옥, 박지선 (11조)
13장 인권 담당교수 : 박 해 긍.
이야기 치료에 대하여 <8조 학문적 글쓰기 발표> 주희록 최은지
WIPO에서의 국제상표 심사 국제상표심사팀 황 영익.
에너지 위기 대처 방안 없는 국가에너지기본계획과 미래에너지비전
중국문학개론 한부와 겅건안문학 중어중국학과 ㅇ이진원 한부와 건안문학.
Presentation transcript:

2014년 가을학기 손시운 (ssw5175@kangwon.ac.kr) 지도 교수: 문양세 교수님 군집 2014년 가을학기 손시운 (ssw5175@kangwon.ac.kr) 지도 교수: 문양세 교수님

군집 분석 (Cluster Analysis) 군집(Clustering) 패턴 공간에 주어진 유한 개의 패턴들이 서로 가깝게 모여서 무리를 이루고 있 는 패턴 집합을 묶는 과정 (출처: aistudy.com) (출처: espin086.wordpress.com) (출처: http://tagging.pui.ch)

K-Means Clustering k-means 군집화 (출처: wikipedia.org)

European Protein Consumption Datasets 25개국 유럽국가 단백질 섭취율(%) 주요 단백질 섭취원 RedMeat(붉은 고기: 소, 돼지 등) WhiteMeat(흰살 고기: 닭 등) Eggs, Milk, Fish Cereals(곡물), Starch(녹말, 전분) Nuts, Fr&Veg(과일 및 야채) 현재 25개의 클러스터보다 더 작은 수의 클러스터로 군집화 e.g. 지중해 연안 국가는 특정 음식의 단백질 섭취율이 높음 Country Red… Whit… Eggs Milk Fish Cere… Star… Nuts Fr&… Albania 10.1 1.4 0.5 8.9 0.2 42.3 0.6 5.5 1.7 Austria 14 4.3 19.9 2.1 28 3.6 1.3 Belgium 13.5 9.3 4.1 17.5 4.5 26.6 5.7 4 Bulgaria 7.8 6 1.6 8.3 1.2 56.7 1.1 3.7 4.2 Czecho… 9.7 11.4 2.8 12.5 2 34.3 5 Denmark 10.6 10.8 25 9.9 21.9 4.8 0.7 2.4 E Germ… 8.4 11.6 11.1 5.4 24.6 6.5 0.8 Finland 9.5 4.9 2.7 33.7 5.8 26.3 5.1 1 France 18 3.3 19.5 28.1 Greece 10.2 3 17.6 5.9 41.7 2.2 Hungary 5.3 12.4 2.9 0.3 40.1 Ireland 13.9 10 4.7 25.8 24 6.2 Italy 9 13.7 3.4 36.8 6.7 Netherla… 13.6 23.4 2.5 22.4 1.8 Norway 9.4 23.3 23 4.6 Poland 6.9 19.3 36.1 6.6 Portugal 14.2 27 7.9 Romania 6.3 1.5 49.6 3.1 Spain 7.1 8.6 7 29.2 7.2 Sweden 3.5 24.7 7.5 Switzerl… 13.1 23.8 2.3 25.6 UK 17.4 20.6 24.3 USSR 16.6 43.6 6.4 W Germ… 18.8 18.6 5.2 3.8 Yugosla… 4.4 55.9 3.2  더 작은 수의 클러스터로 군집화할 수 있을까?

Ex. 1: 데이터 다운로드 데이터 다운로드 http://www.biz.uiowa.edu/faculty/jledolter/DataMining/datatext.html

Ex. 1: 데이터 확인

Ex. 1: Red & White Meat 기반 군집화 kmeans() 함수: R에 기본적으로 내장되어 있는 K-Means 알고리즘 첫 번째 인자: 군집에 사용할 데이터 두 번째 인자(centers): 클러스터의 수(k)

Ex. 1: Red & White Meat 기반 군집화 결과 확인

Ex. 1: Red & White Meat 기반 군집화 플로팅

Ex. 1: 모든 섭취원에 대한 군집화 앞의 예제는 Red Meat와 White Meat로 군집화 다음 예제는 모든 섭취원에 대해 7개의 클러스터로 군집화

Ex. 1: 모든 섭취원에 대한 군집화 플로팅

Ex. 1: 지도 상에서 군집 결과 확인 지도 관련 패키지 로딩

Ex. 1: 지도 상에서 군집 결과 확인 각 나라별 좌표(위도, 경도) 저장

Ex. 1: 지도 상에서 군집 결과 확인 플로팅

Ex. 1: 지도 상에서 군집 결과 확인 플로팅

Iris  Iris 데이터의 종을 군집화할 수 있을까? Datasets: 150개의 Iris 꽃 데이터 Sepal.Length: 꽃 받침 길이 Sepal.Width: 꽃 받침 너비 Petal.Length: 꽃잎 길이 Petal.Width: 꽃잎 너비 Species: 화종 setosa versicolor virginica # Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3 4.7 3.2 1.3 4 4.6 3.1 1.5 5 3.6 6 5.4 3.9 1.7 0.4 7 3.4 0.3 8 9 4.4 2.9 10 0.1 11 3.7 12 4.8 1.6 13 14 4.3 1.1 15 5.8 1.2  Iris 데이터의 종을 군집화할 수 있을까?

Ex. 2: 데이터 초기화 iris 데이터에서 Species(화종)을 제외한 데이터를 추출

Ex. 2: K-Means 알고리즘 사용 kmeans() 함수: R에 기본적으로 내장되어 있는 K-Means 알고리즘 첫 번째 인자: 군집에 사용할 데이터 두 번째 인자: 클러스터의 수(k)

Ex. 2: Plotting Sepal과 Petal의 각 값에 해당하는 군집 결과를 플로팅

Ex. 2: Plotting Sepal과 Petal의 각 값에 해당하는 군집 결과를 플로팅

Hierarchical Clustering 계층형 군집화 계층 트리로 구성된 중첩된 클러스터를 생성한다. 계통수(dendrogram)으로 시각화될 수 있다. 계통수 형태의 트리는 레코드들의 병합/분할의 순서를 나타낸다.

Ex. 3: 데이터 초기화 plotting을 위해 40개의 데이터를 추출 Species(화종) 데이터 제거

Ex. 3: Hierarchical Clustering 사용 hclust() 함수: R에 기본적으로 내장되어 있는 계층형 군집화 알고리즘 첫 번째 인자: 거리가 계산된 데이터 dist() 함수: 거리를 계산하는 함수 "euclidean", "maximum", "manhattan", "canberra", "binary" or "minkowski" method 인자: 계층형 군집화 알고리즘에 적용할 유사도 "ward.D", "ward.D2", "single", "complete", "average" (= UPGMA), "mcquitty" (= WPGMA), "median" (= WPGMC) or "centroid" (= UPGMC)

Ex. 3: Plotting Dendrogram

Density-Based Clustering DBSCAN – 대표적 밀도기반 군집화 알고리즘 한 점으로부터 일정 거리 안에 있는 점들의 수가 특정 값보다 많다면 군집화 eps: 밀도를 측정하는 거리 MinPts: 밀도를 측정하기 위한 점들의 최소 개수 밀도기반 군집화의 장점은 다양한 형태와 크기의 클러스터를 발견할 수 있음 (출처: http://www.slideshare.net/salahecom/10-clusbasic)

Ex. 4: DBSCAN 알고리즘 사용 dbscan() 함수: fps 패키지에서 구현된 DBSCAN 알고리즘 1부터 3행은 뚜렷하게 군집이 되었으나, 0행은 군집이 제대로 되지 않음 0행의 값들은 noise 또는 outlier로 취급

Ex. 4: Plotting ds의 결과를 플로팅 검은색 원이 noise 또는 outlier

Ex. 4: Plotting

Ex. 4: Plotting 첫 번째 컬럼(Sepal.Length)과 네 번째 컬럼(Petal.Length)으로 플로팅

Ex. 4: Plotting plotcluster() 함수: fps 패키지에 있는 플로팅 함수