Big Data & Hadoop. 1. Data Type by Sectors Expected Value using Big Data.

Slides:



Advertisements
Similar presentations
SPEAKER VERIFICATION SYSTEMS 대화형 사용자 인터페이스 개론 정보와 추론 연구실.
Advertisements

빅 데이터의 정의와 특징 빅 데이터의 이용사례 빅 데이터의 문제점 or 한계점 빅 데이터의 전망.
R 프로그래밍 담당교수명 : 서 영 민 연 락 처 :
이혁재 /KASA NoSQL. 요약 NoSQL 소개 데이타베이스 관련 문서 대상 : 클라이언트 프로그래머 NoSQL 소개 데이타베이스 관련 문서 대상 : 클라이언트 프로그래머.
Mining the by Graph API. 1. 페이스북 소셜 그래프와 Graph API, OGP 2. 페이스북 페이지와 친구들에서 좋아요 분석하기 3. 소셜 그래프 분석을 위한 결속집단 분석 4. 소셜 그래프 시각화.
1.Big data의 정의 2.Big data의 분석 1)변화 과정 데이터 규모 데이터 유형 데이터 특성 EB(Exa Byte) (90년대 말=100EB) ZB(Zetta Byte) 진입 (2011년=1.8ZB) ZB 본격화 시대 (‘20년=‘11년대비 50배 증가.
1 08 시스템 구성도 고려사항 * 웹 서버 클러스터 구성  클러스터 구축은 ㈜ 클루닉스의 Encluster 로 구축 (KT 인증,IT 인증 획득, 실제 클러스터 구축 사이트 200 여곳 )  웹 서버 클러스터는 Dynamic, Static, Image.
WCL 이민학 Big Data & Hadoop.
Big Data Chap 3. I. VBRE(Value-Based RE) II. Requirement Prioritization III. AHP(Analytical Hierarchy Process) IV. Requirement Negotiation Q & A.
빅데이터란 ? 1. 빅데이터에 관한 잘못된 상식 빅데이터는 용량과 규모가 매우 큰 데이터를 말한다. 2.
빅데이터 기본 개념 Yonsei University 2 nd Semester, 2015 Sanghyun Park * The slides are from the book “ 시작하세요 ! 하둡 프로그래밍 : 기초부터 실무까지 하둡의 모든 것 ” written by 정재화.
2016 유성환 Hybrid MOBILE.
LHC 데이터 처리 Grid computing
컴퓨터와 인터넷.
컴퓨터 운영체제의 역사 손용범.
사회의 사람들을 이어주는 망과같은역할을 하는 서비스를 SNS라고 한다.
컴퓨터공학과 김소원.
Hive. Part of Hadoop Ecosystems MapReduce Runtime (Dist. Programming Framework) Hadoop Distributed File System (HDFS) Zookeeper (Coordination) Hbase (Column.
ADP BUSINESS SCHOOL is the place learning management skills. You can learn strategy, marketing, leadership, HRM, Operations, International Business, Accounting,
Data Interface, Data mart Technology
뇌를 자극하는 Windows Server 2012 R2
소리가 작으면 이어폰 사용 권장!.
제 11 장 하둡 에코시스템.
뇌를 자극하는 Windows Server 2012 R2
빅데이터 분산 처리 시스템 충북대학교 정보통신공학부 복경수
Power Java 제3장 이클립스 사용하기.
빅데이터 분석 과정.
빅데이터 순환 과정과 플랫폼.
김병곤 / Flamingo Community Meetup Flamingo 소개 김병곤 /
연결리스트(linked list).
MS SQL Server - 마이크로소프트 사가 윈도우 운영 체제를 기반으로 개발한 관계 DBMS
데이터 마이닝 - 강의 개요 년 가을학기 강원대학교 컴퓨터과학전공 문양세.
Korea University of Technology and Education Hongyeon Kim
1. 컴포넌트 개요 – [빅데이터] 기능 개요 컴포넌트 기능 구성도 주요 기능 정의 JDBC Interface 데이터 가공제공
교육팀 도경모 Big.
DAG 기반 분산 스트림 처리 기술 V1.0 ETRI Technology Marketing Strategy
Contents 1. 빅데이터란? 2. 빅데이터 기술 3. In-memory DB 4. 활용 사례 데이터의 종류
Introduction to Big Data, Summer, 2013
Visual Basic .NET 처음 사용하기.
IOT Products and Services : Case Study
Cloudera 하둡 빨간색코딩.
게임에서 공공까지, 국내 실 사례들로 본 빅데이터 융합 분석
                              데이터베이스 프로그래밍 (소프트웨어 개발 트랙)                               퍼스널 오라클 9i 인스톨.
HDFS와 대용량 데이터 처리 콘텐츠서비스연구팀 최완.
ASP.NET AJAX 비동기 게시판 작성 2007 컴퓨터공학실험( I )
뇌를 자극하는 Windows Server 장. 장애 조치 클러스터.
1장. 데이터베이스 자료의 조직적 집합체_데이터베이스 시스템의 이해
디지털회로설계 (15주차) 17. 시프트 레지스터와 카운터 18. 멀티바이브레이터 * RAM & ROM.
강의 개요. 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
2장. 데이터베이스 관리 시스템 데이터베이스 관리 시스템의 등장 배경 데이터베이스 관리 시스템의 정의
소규모 IPTV 사업자용 실시간 미디어 플랫폼 기술
Chapter6 : JVM과 메모리 6.1 JVM의 구조와 메모리 모델 6.2 프로그램 실행과 메모리 6.3 객체생성과 메모리
Tiny OS와 NesC Tiny OS Part1. Won Mi Sun – 17 지능제어 연구실.
ASP.NET AJAX / AJAX Control Toolkit 응용 2008 컴퓨터공학실험( I )
04. DBMS 개요 명지대학교 ICT 융합대학 김정호.
데이터 마이닝 - 강의 개요 년 가을학기 강원대학교 컴퓨터과학전공 문양세.
맵리듀스 Yonsei University 2nd Semester, 2014 Sanghyun Park
네트워크 환경 구축과 이미지 전송 호스트/타겟 통신 직렬 통신을 이용한 이미지 전송 수퍼 데몬 BOOTP 환경 구축
하이브리드 문화 현상 11조 윤주성, 이호, 허성녕.
모바일인터넷기초 전산정보학부 모바일인터넷과 권 춘 우
클러스터 시스템에서 효과적인 미디어 트랜스코딩 부하분산 정책
다차원 색인을 사용하는 실질적인 응용예제 컴퓨터 과학과 이 대 기.
멀티미디어시스템 제 4 장. 멀티미디어 데이터베이스 정보환경 IT응용시스템공학과 김 형 진 교수.
Map Designer Solution 소개자료
Bizforms PowerPoint 네트워크, 시스템6 파워포인트 디자인
학부 컴퓨터공학부 교육과정 (학부) 2학년 4학년 3학년 1학년 1학기 2학기 IPP 자격과정 전공트랙
제3의 미디어, SNS의 힘! 경영학부 권예슬.
학부생 연구원 및 대학원생 모집 DataBio 연구실 (윤영미 교수님) 연구실 소개 연구 과제 모집 대상 혜택 모집 기간
SafeMSR 설정.
소리가 작으면 이어폰 사용 권장!.
Presentation transcript:

Big Data & Hadoop

1. Data Type by Sectors

Expected Value using Big Data

Big Data Cases Case 1: Google Flue

Case 2: SNS 분석 응용

Case 3: Social Metrics Insight

4. 빅데이터 활용 현황

SNS 데이터 분석 활용

5. Hadoop 하둡의 두가지 큰 요소는 분산처리 와 분산저장 이다. 여러 개의 개인 컴퓨터를 병열로 연결, 통합하는 기술이다. Hadoop 은 아래의 4 가지 이슈를 해결 하기 위해 구글에서 만든 GFS 를 기반으로 태어난 분산 시스템이다. Hadoop 은 open 소스 이기 때문에 라이센스 비용이 필요지 않으며 또 한 초기에 작은 클러스터를 구성하여 운영 할 수도 있고 데 이터의 증가에 따라 시스템 확장이 용이 하도록 설계가 되 었기 때문에 일반적인 상용 데이터 분석 솔루션에 비하여 초기 비용이 저렴 하다는 장점이 있다. - 대용량 데이터의 관리 적합한 시스템. - 대용량 데이터의 분석에 맞는 시스템. - 초기 구축 비용을 작게 하여 도입이 가능. - 데이터 증가에 따른 확장이 용이한 시스템.

Hadoop 의 구성

Hadoop 의 2 가지 구성 요소 : HDFS(Hadoop Distributed File System), Map/Reduce –HDFS JAVA 로 개발된 순수 JAVA 파일 시스템으로 페타 바이 트 이상의 대용량 데이터를 저장 하는데 있어 효율적입니다. 시스템 확장이 용이 하며 한두개의 데이 터 노드 장애에도 전혀 문제없이 정상적으로 동작 하며 운영중인 시스템에서의 노드의 추가 / 제거 또한 간 단히 할 수 있습니다. –Map/Reduce Map/Reduce 는 대량의 자원을 다루는 분산 / 병렬 시스 템의 효율적인 지원을 위한 목적으로 Google 에서 만들어낸 프로그래밍 모델입니다.

하둡 구성 요소

하둡 기술

6. Hadoop 의 사용 예 대용량 데이터 통계 및 분석 ex) 서비스 활동성 분석, 사용자 이탈율 분석 등 개인 타케팅 광고. Hadoop 기반 데이터 웨어 하우스 구성. 대용량 실시간 로그 수집. FaceBook 현재 Hadoop 기반의 데이터 웨어 하우스 운영 중. FaceBook 이 개발한 로그 수집 프레임워크인 scribe 를 사용하여 Hadoop 에 로그를 저장. Hadoop 을 이용한 데이터 마이닝 작업을 활발히 하고 있으며 실 서비스 에 이용. 트위터 scribe 를 이용해서 로그를 Hadoop 저장. PIG 를 사용해 데이터 분석. Hbase 를 이용해 사용자 검색 기능 강화.

Hadoop 사례

영화 추천 사례