컴퓨터공학과 20111607 김소원.

Slides:



Advertisements
Similar presentations
회사소개서㈜평화이즈 서울시 서초구 서초동 서초평화빌딩 6 층 TEL : (02) FAX : (02) Pyeonghwa is co.,LtdCompany Overview Copyright©2012.
Advertisements

공학교육인증제도의 효과 및 혜택 광운대학교 전문역량인증원 Professional Capability Accreditation Board of KWU.
이혁재 /KASA NoSQL. 요약 NoSQL 소개 데이타베이스 관련 문서 대상 : 클라이언트 프로그래머 NoSQL 소개 데이타베이스 관련 문서 대상 : 클라이언트 프로그래머.
WCL 이민학 Big Data & Hadoop.
Big Data Chap 3. I. VBRE(Value-Based RE) II. Requirement Prioritization III. AHP(Analytical Hierarchy Process) IV. Requirement Negotiation Q & A.
빅데이터란 ? 1. 빅데이터에 관한 잘못된 상식 빅데이터는 용량과 규모가 매우 큰 데이터를 말한다. 2.
IT 산업의 강국 핀란드 학 과 : 경제학과 학 번 : 발표자 : 송재훈 발표일 :2006 년 9 월 26 일.
- 1/26 - ㈜ 참교육연구소 ㈜ 케이수학 자기 주도형 수학 교육 - 별무리학교 프로그램 ㈜ 참교육연구소 & ㈜ 케이수학.
1 D-Project (DMC 참여 제안서 ). 2 서울 상암동 DMC 지역에 첨단 업무 및 R&D 시설의 비즈니스 집적단지를 조성 함으로써 관련 업체간의 시너지 효과를 통한 경쟁력 강화와 One Stop System 으로 생산성 효율을 높이고자 함 I.D.C (Information.
Big Data & Hadoop. 1. Data Type by Sectors Expected Value using Big Data.
빅데이터 공통기반 및 시범과제 구축 사업 I 사업 개요 II 빅데이터 공통기반 활용포털 구축 III 공통기반을 활용한 분석 사례 V 공통기반을 이용한 통계청 시범과제 구축 IV 시범과제 추진 방안.
지식재산과 산업보안 한국과학기술정보연구원 원장 한선화
경선추 Smart & Green Technology Innovator ‘ 분산 포렌식 인덱스 검색 기술 ’ 이란 수사의 대상이 되는 디지털 데이터에 대한 빠른 검색을 제공하기 위해 분산 처리 기법으로 인덱스를 생성해 두었다가 사용자 요청이 있을 경우, 인덱스에서.
-2013 Electronics and Telecommunications Trends 오지영.
2013 년 헬스케어 이해와 전망. 헬스케어 산업의 이해 건강하게 아름답게 그리고 장수하고 싶은 인간의 기본적 요구에 충실한 사업 건강하게 아름답게 그리고 장수하고 싶은 인간의 기본적 요구에 충실한 사업 한국 헬스케어 산업의 성장은 산업화 만큼 빠르게 진행 중 1) 고령화.
프로젝트 제안서 날씨대로 기분대로 팀원 박효민 신준범 정민섭 안성원
수학 수행평가 김재환.
데이터 파일 열기 데이터 편집기 상에서 새로운 데이터 파일을 만들거나, 혹은 기존의 파일을 불러올 수 있음.
시뮬레이션센터 설계 및 운영전략 일 시 : 2014년 7월 9일(수) 9:00~17:30 대 상 : 간호학과 교수 40명
Hive. Part of Hadoop Ecosystems MapReduce Runtime (Dist. Programming Framework) Hadoop Distributed File System (HDFS) Zookeeper (Coordination) Hbase (Column.
HDFS Tutorial.
SW사업의 특성을 반영한 용역계약일반조건 개정(9/29)
Hadoop 동작방식(F5를 눌로 슬라이드쇼로 볼 것!!)
장애인권익보호협의회 사례발표 사회복지법인 서림복지원 seolim welfare center 『희망나눔 결연사업 발대식』
빅데이터 분산 처리 시스템 충북대학교 정보통신공학부 복경수
빅데이터 분석 과정.
빅데이터 순환 과정과 플랫폼.
BIG Data 컴퓨터응용과학부 박진완.
Distributed Computing (Apache Hadoop & Hive Review)
Apache Hive 빅데이터 분산 컴퓨팅 박영택.
빅데이터 분석을 위한 통계 프로그래밍 R 오 승 근
Advanced Data Analytics 데이터분석 전문가
Korea University of Technology and Education Hongyeon Kim
교육팀 도경모 Big.
What is‘Big Data’? - 빅 데이터에 대한 전반적인 이해 네트워크 컴퓨팅 프로젝트 김충현
개선된 ATMSim을 이용한 DDoS 공격 분석
정부지원 ERP를 활용한 영업솔류션 및 활용 작성자 : 국가공인재무설계사 김 춘 수
Hadoop 김연왕
Hadoop 김연왕
Hadoop 김연왕
14장. NFS 서버의 설치와 운영.
제 37차 한•일 농림수산기술협력위원회 참석결과
게임에서 공공까지, 국내 실 사례들로 본 빅데이터 융합 분석
HDFS와 대용량 데이터 처리 콘텐츠서비스연구팀 최완.
하둡 기반 빅데이터 처리 방법.
인공 지능 시대에 필요한 인재 행복한 미래를 만드는 기술자 김송호.
현대엠엔소프트 자소서가이드북 2018년 상반기 취업성공은 내일취업코칭스쿨에서
제주북초등학교 영재 기초반 20번 정수은 지도 교사 : 김대진 선생님
무역KEYNOTE 중·고등학생을 위한.
톡톡 튀고, 개성 넘치는 우유팩으로 새롭게 꾸며봐요!
DataScience Lab. 박사과정 김희찬 (목)
분산 파일 시스템의 구조 GFS 와 CEPH SW공학센터 융합SW공학팀 장원석 책임 연구원
Hadoop Chapter 2. 맵리듀스 김영지.
네트워크 설정 방법 (측정값데이터수집설정)
미래의 커뮤니케이션 기술과 이 기술이 인간에 미치는 영향
WINIA e-PURCHASING SYSTEM Copyrightⓒ 2002 by MCC. All right reserved..
어떤 금속이 열전도가 빠른지 찾기 평택여자중학교 김수민.
정보 INFRA 구축 RF카드를 이용한 고객관리시스템 구축 에클라트소프트.
Topic Subtopic 조명욱, Jo Myung Wook 가비아 웹메일 서비스와 GFS GABIA. INC.
Refer system Manual 이화여자대학교 의료원
Advanced Data Analytics 데이터분석 전문가
농심 기업분석 3조 조재록 정대주 김원중 오기영 이주열.
리더 코딩 스토리 디자인 박찬준 이근영 박동현 박나영
▶서류관리 프로그램 1. 로그인….2 2. 서류등록 … 서류도착 서류스티커발행
빅데이터 분석 다양한(Variety) 형태로 수집, 저장된 대용량(Volume)의 데이터들을
유예 X-FILE *조사자* 1301권희원 1315이예지 1317장아정 1322홍자현.
2장. 데이터베이스 관리 시스템 데이터베이스 관리 시스템의 등장 배경 데이터베이스 관리 시스템의 정의
모바일 주문 시스템 매뉴얼 (고객사 주문).
타분야 학습 전동차 분야 (전기 전자) 인 재 개 발 원 교수 이남표.
IP-in-IP Tunneling 기술 ETRI Technology Marketing Strategy
Presentation transcript:

컴퓨터공학과 20111607 김소원

목차 하둡의 역사 하둡의 배경 하둡의 정의 하둡의 구조 하둡의 사례 하둡의 현황

GFS(Google File System)? 하둡의 역사 2005년 더그 커팅과 마이크 캐퍼렐라(Mike Cafarella)가 개발 당시 커팅은 야후에서 일하고 있었으며, 이후 하둡은 아파치(Apache) 재단으로 넘어가 공개 소프트웨어로 개발 하둡은 구글의 분산 파일 시스템(GFS) 논문이 공개된 후, 그 구조에 대응하는 체계로 개발 GFS(Google File System)? 대량의 정보를 효과적으로 저장하기 위함

하둡의 역사 하둡의 로고 노랑색 아기 코끼리 하둡의 개발자인 더그 커팅이 자신의 아이가 가지고 놀던 장난감 코끼리의 이름을 따서 하둡 코끼리는 빅데이터(Big Data)를 상징하는 동물 2011년 오픈 소스 아파치 하둡(Apache Hadoop) 사업을 위해 야후에서 분사한 기업의 이름을 지을 때도, 코끼리가 주인공인 동화에 나오는 코끼리 이름인 호튼(Horton)을 따와서 호튼웍스(Hortonworks)라고 회사명을 지었다.

기존 데이터를 비용 대비 효율적 처리할 수 있는 방법론 꾸준히 요구 하둡의 배경 한계점 : 스토리지나 컴퓨팅 자원 부족 비용이 많이 듦 관련기술이나 엔지니어 부족 성능 좋고 값비싼 시스템 슈퍼컴퓨터를 이용한 큰 데이터 처리 기존 데이터를 비용 대비 효율적 처리할 수 있는 방법론 꾸준히 요구 하둡(hadoop)

하둡의 정의 여러 개의 저렴한 컴퓨터를 마치 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술 장점 오픈소스로 라이선스에 대한 비용 부담 적음 시스템을 중단하지 않더라도 장비의 추가 및 삭제가 용이 일부 장비에 장애가 발생하더라도 전체 시스템 사용성에 영향이 적음 저렴한 구축 비용과 비용 대비 빠른 데이터 처리 데이터의 복제 본을 저장하기 때문에 서버의 장애가 발생했을 때도 데이터의 복구 가능. 단점 HDFS에 저장된 데이터는 변경 불가 대용량 데이터의 배치 처리에는 적합하나, 스트리밍과 같은 실시간성 데이터 분석이나, 신속성이 보장되어야 하는 작업에는 부적합. Hadoop 엔지니어의 부족.

하둡의 구조 하둡 분산파일 시스템(HDFS): 파일을 여러 대의 서버에 분산 저장하기 위한 파일시스템 맵리듀스(MapReduce): 각 서버에서 데이터를 분산 처리하는 분산병렬처리를 위한 프레임워크

하둡의 구조

하둡의 사례 데이터 중 일부를 하둡에 저장 그 양은 약 30PB(미국 국회도서관에 저장돼 있는 정보량의 3배) 페이스북은 하둡을 이용해 대용량 사진 데이터를 작은 데이터로 쪼개 처리(약 2천여개의 서버가 매 순간 데이터를 처리) 사용자가 사진을 쉽게 올리고 내려 받으며, 다른 사람의 페이스북 사진을 클릭과 동시에 볼 수 있는 이유

하둡의 사례 2008년부터 빅데이터 처리를 위해 하둡을 도입 모바일 데이터를 분석하고, 서비스(네이트 뉴스, 네이트 컬러링)를 사용자에게 맞춤형으로 제공 하둡을 도입해 실시간으로 고객 데이터를 수집하고 처리해 맞춤형 서비스 개발에 나섬

IDC(Internet Data Center)? 하둡의 현황 IDC(Internet Data Center)? 기업의 전산시설을 위탁 관리하는 곳. IDC는 ‘하둡과 맵리듀스 생태계 소프트웨어 풍경 2012’ 보고서를 통해 2011년 7700만달러 수준인 하둡과 맵리듀스 관련 시장이 2016년이 되면 8억1280만달러에 이를 것으로 내다봤다. 보고서는 하둡 관련 시장이 해마다 60% 이상 성장할 것이라고 전망했다.

하둡의 현황 하둡의 부족한 기능을 서로 보완하는 ‘하둡 에코시스템’

하둡의 현황

참고자료 http://ko.wikipedia.org/wiki/%ED%95%98%EB%91%A1 하둡의 역사 http://linuxism.tistory.com/888 하둡의 로고 http://navercast.naver.com/contents.nhn?rid=122&contents_id=44732 하둡의 배경, 사례, 현황 http://118k.tistory.com/71 하둡의 구조 http://1004jonghee.tistory.com/24#recentTrackback 하둡의 장단점