Data Mining 에 대하여... 건양대학교 컴퓨터학과 / 유 태 규 안녕하십니까?

Slides:



Advertisements
Similar presentations
신진영 현지 조사 방법 및 보고서 작성법 제 7 강 - 자료 수집과 설문지 작성 -
Advertisements

SPEAKER VERIFICATION SYSTEMS 대화형 사용자 인터페이스 개론 정보와 추론 연구실.
지지금 우리나라에서는 정보보안전문가가 약 500 명도 되지 않는다. 그그리고 지금 컴퓨터를 쓰지 않는 곳이 없다. 또, 농협 해킹 등 여러 가지 이유 등으로 유망하다.
Big Data & Hadoop. 1. Data Type by Sectors Expected Value using Big Data.
SNS ! 건대 ▶ 오리 정보 제공 : 해당 지역에서 이슈화 되고 있는 서비스, 제품의 기업에게 정보 제공.
영화 예매 시스템 - 많이 봤다이가 ? CSE Corp. PM 송진희 김성욱 김보람 천창영.
ICT 기반 베이비붐 세대 창업 사업계획서 작성양식. 목차 1. 창업 동기 2. 지원 동기 3. 자체역량 분석 4. 시장 전망 5. 재무 분석 6. 창업자 및 경영진 준비하시는 사업 특성에 따라 목차 및 세부내용의 일부 변경 ( 추가 및 Skip) 은 가능합니다.
대표자명 / 연락처 / 이메일 ( 기 창업인 경우 회사 명칭 ) 지원하려는 사업 명칭 사업계획서 작성양식.
금융산업 발전을 위한 금융수학의 역할 가톨릭대학교 전인태 가톨릭대학교 전인태. 금융산업 개인 기관투자자 연기금 보험회사 등등 개인 기관투자자 연기금 보험회사 등등 다양한 형태 기술 아이디어 기업 기술 아이디어 기업 다양한 형태 매칭 자금조달 투자상품제공 주식, 채권 전환사채.
컴퓨터와 인터넷.
CRM의 성공사례와 실패사례 6조 송혜정 신은수 원종환
논문 모집 안내 한국BI데이터마이닝학회 빅 데이터 시대의 데이터마이닝 역할 초대의 글 주요 일정
Customer loyalty! 고객충성도
Deep Learning.
Deep Learning.
블룸의 교육목표분류학 (Bloom’s Taxonomy)
의사 결정 트리(decision tree)
MS-Access의 개요 1강 MOS Access 2003 CORE 학습내용 액세스 응용 프로그램은 유용한 데이터를
Entity Relationship Diagram
제 9 장 데이터 웨어하우스의 구조 박 종수 성신여자대학교 컴퓨터정보학부 2002 정보공학특강1.
데이터베이스 및 설계 금오공과대학교 컴퓨터공학부 이 이섭.
Learning Classifier using DNA Bagging
데이터 마이닝 - 강의 개요 년 가을학기 강원대학교 컴퓨터과학전공 문양세.
데이터 마이닝 Data Mining 김홍주 김기흔 최준혁.
컴퓨터과학 전공탐색 배상원.
멀티미디어 시스템 (아날로그 이미지,신호를 디지털로 변환 방법) 이름 : 김대진 학번 :
MicroStrategy6 컴퓨터학과 석사 2학기 진수경.
                              데이터베이스 프로그래밍 (소프트웨어 개발 트랙)                               퍼스널 오라클 9i 인스톨.
SK Telecom 매출 통계 시스템의 SQL Server Reporting Services 적용사례
소매경영의 특성과 유통전략 1. 소매의 정의 “최종고객에게 그들이 원하는 제품이나 서비스를 판매하는 행위”
간지 Ⅰ. 시스템소개 Autoway Groupware User Manual Ⅰ. 시스템 소개 | 시스템 소개.
제1장 통계학이란 무엇인가 제2장 자료와 수집 제3장 자료 분석 방법
지도교수 : 이상훈교수님 학과 : 컴퓨터시뮬레이션 학번 : 이름 : 진선미
V. 인류의 건강과 과학 기술 Ⅴ-1. 식량자원 3. 식품 안전성.
군집 분석.
재무회계의 개념체계 재무회계의 목적 회계의 기본가정 회계정보의 질적 특성 재무제표의 구성요소 회계원칙(회계기준) 제약조건
시뮬레이션 기반 가상 보조기구 알고리즘 최적화
NFC를 이용한 데이터 수집 및 분석t 디자인 3조 [Bos]- 강윤중 고은미 김영택 이수민.
품질의 세가지 개념 김연성 (인하대 경영학부 교수).
Clipping 이진학.
Chapter 03. 관계 데이터베이스 설계.
Google 애널리틱스로 광고 성과 분석하기
04. DBMS 개요 명지대학교 ICT 융합대학 김정호.
BIC 사례 1 연관규칙과 분류모형을 결합한 상품 추천 시스템: G 인터넷 쇼핑몰 사례
Decision Tree & Ensemble methods
데이터마이닝, 빅데이터, 데이터과학: 정의 데이터마이닝(data mining)
9강. 클래스 실전 학사 관리 프로그램 만들기 프로그래밍이란 결국 데이터를 효율적으로 관리하기 위한 공구
데이터 마이닝 - 강의 개요 년 가을학기 강원대학교 컴퓨터과학전공 문양세.
판매 교육 발표자: [이름].
웹사이트 분석과 설계 (화면 설계) 학번: 성명: 박준석.
알고리즘 알고리즘이란 무엇인가?.
김정숙 (고려대학교 2014년) 국어국문학과 한국어학 석사 1기 이 드미뜨리
3장, 마케팅조사의 일번적 절차 마케팅 조사원론.
주요 프로그램 고객 요청에 의거 품질/개발 분야 각 3개 과정으로 구분하여 교육 계획을 수립 하였으며,
다차원 색인을 사용하는 실질적인 응용예제 컴퓨터 과학과 이 대 기.
6장 데이터관리와 비즈니스 인텔리전스 경영정보시스템 4차 산업혁명 시대를 위한 데이터생성 및 관리를 통한 경쟁력 강화
생산 운영관리의 기초 공 정 설 계 생산능력계획 및 일정계획 재 고 관 리 노동인력관리 품질관리 및 설비보전 생산의 국제화
1. 비정형 데이터마이닝의 이해.
Part 2 개념적 데이터 모델 Copyright © 2006 by Ehan Publishing Co. All rights reserved.
멀티미디어시스템 제 4 장. 멀티미디어 데이터베이스 정보환경 IT응용시스템공학과 김 형 진 교수.
11장 배열 1. 배열이란? 1.1 배열의 개요 1.2 배열의 선언과 사용.
비교분석 보고서 Template 2015.
텍스트 분석 ㈜ 퀀트랩.
1. 정보 과학과 정보 사회 1-1. 정보 과학 기술의 역사.
마케팅 의사결정과정 시장조사 의사결정 시장 상황 분석
.Net FrameWork for Web2.0 한석수
교량 구조물의 개념 설계 및 프로토타입 제작 과정
                              데이터베이스 설계 및 실습 #6 - SQL 실습 한국외국어대학교 DaPS 연구실                              
학부생 연구원 및 대학원생 모집 DataBio 연구실 (윤영미 교수님) 연구실 소개 연구 과제 모집 대상 혜택 모집 기간
1 제조 기술의 세계 3 제품의 개발과 표준화 제품의 개발 표준화 금성출판사.
Presentation transcript:

Data Mining 에 대하여... 건양대학교 컴퓨터학과 / 06609031 유 태 규 2009. 3. 18 안녕하십니까? 금감위원장 윤증현 입니다. 오늘 대통령님을 모시고… 2009. 3. 18 건양대학교 컴퓨터학과 / 06609031 유 태 규

Contents 1. Date Mining 출현 배경 2. Date Mining 3. Date Mining 의 도구 4. Date Mining 의 활용분야

Date Mining 출현 배경

Date Mining 출현 배경 Date Mining의 출현 배경 데이터 베이스의 증가 Terabyte = 240 bytes Data Mining은 우리가 정확한 지식을 찾을 수 있게 도와준다. 요즘은 데이터의 양은 증가하나.. 정확한 정보를 얻기는 힘들다.

Date Mining

Date Mining Date Mining은 대용량 데이터로부터 패턴과 규칙 형태의 새로운 지식을 발견하는 작업이다. 여기에서 지식 발견이란 데이터에 고급 통계 분석과 모델링 기법을 적용하여 유용한 패턴과 관계를 찾아내는 과정이다. 데이터베이스 마케팅의 핵심 기술이라고 할 수 있다. Date Mining(Mine : 캐다) 정보 검색 적합한 정보(지식) 데이터베이스

Date Mining 통계기법이 있는데 굳이 Date Mining이 필요한가? 데이터마이닝은 통계 전문가가 아닌 일반적인 최종 사용자에 의해서 사용된다. 데이터마이닝 도구들은 종종 데이터의 분석 뿐만 아니라 결과의 이해를 용이하게 해 주는 다른 도구들과 함께 제공되며 이러한 도구들은 데이터 분석가들의 전유물이 아니라 사용자들이 데이터를 효과적으로 분석 할 수 있는 능력을 제공하기 때문에 데이터마이닝 기술이 주목 받고 있는 것이다.

Date Mining Date Mining과 지식 발견의 목표 데이터마이닝의 목적은 예측, 식별, 분류, 최적화의 네 가지로 분류 예측에서는 향후 발생할 사건을 예측함 식별에서는 사건과 활동의 존재를 식별하는데 이용되는 패턴을 발견함 분류에서는 데이터를 클래스 혹은 카테고리로 분할함 최적화에서는 주어진 제약 조건 하에서 시간과 공간, 자금과 재료 등과 같은 제한된 자원을 최적으로 사용하여 이익을 최대화하는데 있음

Date Mining 지식 발견 과정으로서의 Date Mining 데이터베이스 내에서 지식 발견은 데이터 마이닝 이상의 의미를 가짐 지식 발견의 6단계 데이터 추출 (Date Selection) 데이터 정제 (Date Cleansing) 데이터 내용 강화 (Date Enrichment) 데이터 변형 (Date Transformation) 또는 인코딩(Encoding) 데이터 마이닝 (Date Mining) 보고서 작성(Reporting) 단계

Date Mining Process 데이터 베이스 /데이터 웨어하우스 해석 및 평가 데이터마이닝 지식제공 분석용 데이터 패턴 결과의 이해 데이터마이닝 패턴 지식제공 분석용 데이터 선택된 데이터 적 용 데이터 정제 데이터 추출 데이터 변형 및 내용 강화 데이터 베이스 /데이터 웨어하우스

Date Mining 데이터 마이닝의 5단계 Sampling (추출 단계) Exploration (탐색 단계) 적절한 양의 표본을 원 자료로부터 추출하는 단계 시간과 비용의 절약과 함께 효율적인 모형의 구축에 필수적이다. 임의추출법, 층화추출법 등이 있다. Exploration (탐색 단계) 여러 가지 자료의 탐색을 통해 기본적인 정보 (기초통계자료, 도수분포표, 평균, 분산, 비율 등)를 획득하는 단계

Date Mining 데이터 마이닝의 5단계 (~계속) Modification (변화 단계) Modeling (모형 작성단계) 데이터의 효율적인 사용을 위한 변수의 변환, 수량화, 그룹화 등을 통하여 데이터를 변환하는 단계 Modeling (모형 작성단계) 데이터마이닝의 핵심 분석목적에 따라 적절한 기법을 사용하여 예측모형을 만드는 단계

Date Mining 데이터 마이닝의 5단계 (~계속) Assessment (평가 단계) 모형화의 결과에 대한 신뢰성, 유용성 등을 평가하는 단계 도구: 리프트도표(Lift Chart), ROC(Reciever Operating Characteristic)곡선, 이익도표(Return on Investment)곡선 등

Date Mining의 도구

Date Mining의 도구 대부분의 마이닝 도구들 연관규칙 (Associations) 예측이 아니라 연관성 정도 측정 클러스터링 (Clustering) 및 분류 목전변수 예측이 아닌 데이터 윤곽을 잡을 때 사용 의사결정나무 (Decision Trees) 신경망모형보다 예측력은 떨어지지만 이유를 설명해야 할 때 사용 신경망무형 (Neural Networks) 인간 두뇌를 흉내내 반복학습과정에서 패턴 도출 일반화함, 향후예측, 정확한 예측력

Date Mining의 활용분야

Date Mining의 활용분야 통계기법이 있는데 굳이 Date Mining이 필요한가? 데이터마이닝은 통계 전문가가 아닌 일반적인 최종 사용자에 의해서 사용된다. 데이터마이닝 도구들은 종종 데이터의 분석 뿐만 아니라 결과의 이해를 용이하게 해 주는 다른 도구들과 함께 제공되며 이러한 도구들은 데이터 분석가들의 전유물이 아니라 사용자들이 데이터를 효과적으로 분석 할 수 있는 능력을 제공하기 때문에 데이터마이닝 기술이 주목 받고 있는 것이다.

Date Mining의 활용분야 Date Mining의 응용 분야 마케팅 ·고객의 구매패턴에 기반을 둔 고객 성향 분석, 광고와 점포의 위치 및 타켓 메일링 등을 포함하는 마케팅 전략의 수립, 고객과 상점 및 상품의 분류, 그리고 카탈로그와 상점 레이아웃 및 광고 캠페인 등의 디자인에 사용 된다. 금융·고객의 신용가치 분석과, 계좌 분류, 주식이나 채권 및 투자 신탁과 같은 금융 투자 분석, 금융 옵션들의 평가, 사기 행위 적발 등에 사용된다. 제조·기계, 인력, 재료와 같은 자원들의 최적화, 제조과정의 최적 설계, 작업 현상 구조 개선, 제품 디자인 등에 사용된다. 의료 ·치료에 대한 효과 분석, 병원 내에서 치료 과정의 최적화, 환자의 약의 부작용 분석, 유전자를 이용한 제약계발과 질병치료 등에 이용된다.

마무리...