Presentation is loading. Please wait.

Presentation is loading. Please wait.

Data Mining 에 대하여... 건양대학교 컴퓨터학과 / 유 태 규 안녕하십니까?

Similar presentations


Presentation on theme: "Data Mining 에 대하여... 건양대학교 컴퓨터학과 / 유 태 규 안녕하십니까?"— Presentation transcript:

1 Data Mining 에 대하여... 건양대학교 컴퓨터학과 / 06609031 유 태 규 2009. 3. 18 안녕하십니까?
금감위원장 윤증현 입니다. 오늘 대통령님을 모시고… 건양대학교 컴퓨터학과 / 유 태 규

2 Contents 1. Date Mining 출현 배경 2. Date Mining 3. Date Mining 의 도구 4. Date Mining 의 활용분야

3 Date Mining 출현 배경

4 Date Mining 출현 배경 Date Mining의 출현 배경
데이터 베이스의 증가 Terabyte = 240 bytes Data Mining은 우리가 정확한 지식을 찾을 수 있게 도와준다. 요즘은 데이터의 양은 증가하나.. 정확한 정보를 얻기는 힘들다.

5 Date Mining

6 Date Mining Date Mining은 대용량 데이터로부터 패턴과 규칙 형태의 새로운 지식을 발견하는 작업이다. 여기에서 지식 발견이란 데이터에 고급 통계 분석과 모델링 기법을 적용하여 유용한 패턴과 관계를 찾아내는 과정이다. 데이터베이스 마케팅의 핵심 기술이라고 할 수 있다. Date Mining(Mine : 캐다) 정보 검색 적합한 정보(지식) 데이터베이스

7 Date Mining 통계기법이 있는데 굳이 Date Mining이 필요한가?
데이터마이닝은 통계 전문가가 아닌 일반적인 최종 사용자에 의해서 사용된다. 데이터마이닝 도구들은 종종 데이터의 분석 뿐만 아니라 결과의 이해를 용이하게 해 주는 다른 도구들과 함께 제공되며 이러한 도구들은 데이터 분석가들의 전유물이 아니라 사용자들이 데이터를 효과적으로 분석 할 수 있는 능력을 제공하기 때문에 데이터마이닝 기술이 주목 받고 있는 것이다.

8 Date Mining Date Mining과 지식 발견의 목표
데이터마이닝의 목적은 예측, 식별, 분류, 최적화의 네 가지로 분류 예측에서는 향후 발생할 사건을 예측함 식별에서는 사건과 활동의 존재를 식별하는데 이용되는 패턴을 발견함 분류에서는 데이터를 클래스 혹은 카테고리로 분할함 최적화에서는 주어진 제약 조건 하에서 시간과 공간, 자금과 재료 등과 같은 제한된 자원을 최적으로 사용하여 이익을 최대화하는데 있음

9 Date Mining 지식 발견 과정으로서의 Date Mining
데이터베이스 내에서 지식 발견은 데이터 마이닝 이상의 의미를 가짐 지식 발견의 6단계 데이터 추출 (Date Selection) 데이터 정제 (Date Cleansing) 데이터 내용 강화 (Date Enrichment) 데이터 변형 (Date Transformation) 또는 인코딩(Encoding) 데이터 마이닝 (Date Mining) 보고서 작성(Reporting) 단계

10 Date Mining Process 데이터 베이스 /데이터 웨어하우스 해석 및 평가 데이터마이닝 지식제공 분석용 데이터 패턴
결과의 이해 데이터마이닝 패턴 지식제공 분석용 데이터 선택된 데이터 적 용 데이터 정제 데이터 추출 데이터 변형 및 내용 강화 데이터 베이스 /데이터 웨어하우스

11 Date Mining 데이터 마이닝의 5단계 Sampling (추출 단계) Exploration (탐색 단계)
적절한 양의 표본을 원 자료로부터 추출하는 단계 시간과 비용의 절약과 함께 효율적인 모형의 구축에 필수적이다. 임의추출법, 층화추출법 등이 있다. Exploration (탐색 단계) 여러 가지 자료의 탐색을 통해 기본적인 정보 (기초통계자료, 도수분포표, 평균, 분산, 비율 등)를 획득하는 단계

12 Date Mining 데이터 마이닝의 5단계 (~계속) Modification (변화 단계) Modeling (모형 작성단계)
데이터의 효율적인 사용을 위한 변수의 변환, 수량화, 그룹화 등을 통하여 데이터를 변환하는 단계 Modeling (모형 작성단계) 데이터마이닝의 핵심 분석목적에 따라 적절한 기법을 사용하여 예측모형을 만드는 단계

13 Date Mining 데이터 마이닝의 5단계 (~계속) Assessment (평가 단계)
모형화의 결과에 대한 신뢰성, 유용성 등을 평가하는 단계 도구: 리프트도표(Lift Chart), ROC(Reciever Operating Characteristic)곡선, 이익도표(Return on Investment)곡선 등

14 Date Mining의 도구

15 Date Mining의 도구 대부분의 마이닝 도구들 연관규칙 (Associations)
예측이 아니라 연관성 정도 측정 클러스터링 (Clustering) 및 분류 목전변수 예측이 아닌 데이터 윤곽을 잡을 때 사용 의사결정나무 (Decision Trees) 신경망모형보다 예측력은 떨어지지만 이유를 설명해야 할 때 사용 신경망무형 (Neural Networks) 인간 두뇌를 흉내내 반복학습과정에서 패턴 도출 일반화함, 향후예측, 정확한 예측력

16 Date Mining의 활용분야

17 Date Mining의 활용분야 통계기법이 있는데 굳이 Date Mining이 필요한가?
데이터마이닝은 통계 전문가가 아닌 일반적인 최종 사용자에 의해서 사용된다. 데이터마이닝 도구들은 종종 데이터의 분석 뿐만 아니라 결과의 이해를 용이하게 해 주는 다른 도구들과 함께 제공되며 이러한 도구들은 데이터 분석가들의 전유물이 아니라 사용자들이 데이터를 효과적으로 분석 할 수 있는 능력을 제공하기 때문에 데이터마이닝 기술이 주목 받고 있는 것이다.

18 Date Mining의 활용분야 Date Mining의 응용 분야
마케팅 ·고객의 구매패턴에 기반을 둔 고객 성향 분석, 광고와 점포의 위치 및 타켓 메일링 등을 포함하는 마케팅 전략의 수립, 고객과 상점 및 상품의 분류, 그리고 카탈로그와 상점 레이아웃 및 광고 캠페인 등의 디자인에 사용 된다. 금융·고객의 신용가치 분석과, 계좌 분류, 주식이나 채권 및 투자 신탁과 같은 금융 투자 분석, 금융 옵션들의 평가, 사기 행위 적발 등에 사용된다. 제조·기계, 인력, 재료와 같은 자원들의 최적화, 제조과정의 최적 설계, 작업 현상 구조 개선, 제품 디자인 등에 사용된다. 의료 ·치료에 대한 효과 분석, 병원 내에서 치료 과정의 최적화, 환자의 약의 부작용 분석, 유전자를 이용한 제약계발과 질병치료 등에 이용된다.

19 마무리...


Download ppt "Data Mining 에 대하여... 건양대학교 컴퓨터학과 / 유 태 규 안녕하십니까?"

Similar presentations


Ads by Google