개발 환경 소개. 빅데이터 분석을 위한 환경 빅데이터의 특징  Volume : 데이터의 양 (TB 부터 PB 정도의 데이터 )  Variety : 정형 / 비정형 / 반정형 데이터  Velocity : Streaming 성 데이터의 실시간 분석 빅데이터 분석을 위한.

Slides:



Advertisements
Similar presentations
CI(Continuous Integration) 이학성. C ontinuous I ntegration? 2 지속적으로 품질관리 를 적용하는 과정 개발자가 기존 코드의 수정 작업 을 시작할 때, 코드 베이스의복사본을 받아서 작업을 시작하면서 코드의 변경.
Advertisements

ScanMail for Lotus Notes ( 주 ) 한국트렌드마이크로. RUNNING HEADER, 14 PT., ALL CAPS, Line Spacing=1 line ScanMail Notes 의 주요 기능 Domino 환경의 Antivirus, Content Filter.
⊙ 전기생산을 위해 공장마다 자가발전기를 구축하는 대신 발전소에서 전기를 받아 이용하는 것처럼, 클라우드는 IT·SW자원을 네트워크로 접속하여 이용하는 방식.
1 08 시스템 구성도 고려사항 * 웹 서버 클러스터 구성  클러스터 구축은 ㈜ 클루닉스의 Encluster 로 구축 (KT 인증,IT 인증 획득, 실제 클러스터 구축 사이트 200 여곳 )  웹 서버 클러스터는 Dynamic, Static, Image.
한국클라우드서비스협회 ▶ 제키톡 서비스 - 제키톡 서비스 ∙ 안드로이드 기반의 모바일 무료 메시지, 무전기, 채팅 어플리케이션으로 국내뿐만 아니라 전세계 대상으로 서비스 제공 중 ∙ 현재 안드로이드폰을 대상으로 서비스 중이며, 아이폰을.
Microsoft ANSWER 이명희 이경서 김나은 김정현 서리다 유시은 이재현 심광철.
Big Data & Hadoop. 1. Data Type by Sectors Expected Value using Big Data.
1)RACK 2)UPS 3)P D U 장치 4)Server Group 5)KVM Switch 7)UPS 를 위한 HUB 6) RACK Monitor.
Proprietary ETRI OOO 연구소 ( 단, 본부 ) 명 1 CDN 을 위한 캐시 시험 모듈 소프트웨어연구부문 빅데이터 SW 플랫폼연구부 분석소프트웨어연구실 ETRI Technology Marketing Strategy ETRI Technology Marketing.
.Net History. Visual Studio.Net 2002 /.Net Framework 1.0 제품의 버전 / 특징 2002 년 - Visual Studio.Net 2002 /.Net Framework 1.0 첫 통합 개발 환경 - C# 언어 등장 (C# 1.0)
[ 정보화 전략의 이론과 실제 ] Open Source & Cloud Computing 주 제 : 오픈소스기반의 클라우드 컴퓨팅 발 표 : 임 현 승 (25 기 )
인사. 저희 조가 클라우드 기업 사례로 LG CNS를 조사한 이유는 LG CNS가 LG 회사에 적용한 인프라 클라우드 컴퓨팅을 상품화하여 서비스 사례를 만들어냈기 때문입니다. 7주차 과제 S2 사랑조.
구축사례 ( 농협 ) 구축기간 구축목적 특이사항 2001년3월 ( 지속적인 증설 진행중 )
2016 유성환 Hybrid MOBILE.
컴퓨터공학과 대학원 소개 자료 컴퓨터공학과 대학원.
컴퓨터와 인터넷.
The Value Chain of Telecommunications Service
컴퓨터 운영체제의 역사 손용범.
목 차 C# 언어 특징 .NET 프레임워크 C# 콘솔 프로그램 C# 윈도우 프로그램 실습 프로그래밍세미나 2.
일반 요구 사항 비즈니스 요구사항 고객/정보/위치/상태 탐색방법 제품/서비스 홍보 및 광고 방법
네트워크 기술을 통한 현재와 미래 소개.
뇌를 자극하는 Windows Server 2012 R2
Power Java 제3장 이클립스 사용하기.
Entity Relationship Diagram
Ch.07-5 xml-rpc 사용하기 김상엽.
1. Windows Server 2003의 역사 개인용 Windows의 발전 과정
김병곤 / Flamingo Community Meetup Flamingo 소개 김병곤 /
Windows Server 장. Windows Server 2008 개요.
Cloud & Openstack suckzoo.
운영체제 박상민.
무선인터넷 보안기술 컴퓨터공학부 조한별.
31강 JAVA 네트워크 JAVA 네트워크 InetAdress, URLConnection 클래스 Socket의 이해
Contents 1. 빅데이터란? 2. 빅데이터 기술 3. In-memory DB 4. 활용 사례 데이터의 종류
IOT Products and Services : Case Study
MicroStrategy6 컴퓨터학과 석사 2학기 진수경.
                              데이터베이스 프로그래밍 (소프트웨어 개발 트랙)                               퍼스널 오라클 9i 인스톨.
모바일 자바 프로그래밍 JDBC / WAP Ps lab 오민경.
HDFS와 대용량 데이터 처리 콘텐츠서비스연구팀 최완.
뇌를 자극하는 Windows Server 장. Windows Server 2008 개요.
SK Telecom 매출 통계 시스템의 SQL Server Reporting Services 적용사례
Wireless Java Programming
Cloud Computing 9 조 비즈니스IT 윤동섭 이승엽 심영준.
Transmission & Analysis
2장. JSP 프로그래밍을 위한 환경구성 제2장.
아틱 기반 전력 통합 모니터링 시스템 검증을 위한
2장. 데이터베이스 관리 시스템 데이터베이스 관리 시스템의 등장 배경 데이터베이스 관리 시스템의 정의
소규모 IPTV 사업자용 실시간 미디어 플랫폼 기술
뇌를 자극하는 Windows Server 장. 원격 접속 서버.
USN(Ubiquitous Sensor Network)
OS 역사 손병규.
-네트워크 관리 개요 및 SNMP 프로토콜 동작과정
9강. 클래스 실전 학사 관리 프로그램 만들기 프로그래밍이란 결국 데이터를 효율적으로 관리하기 위한 공구
데이터 베이스 DB2 관계형 데이터 모델 권준영.
ALLPPT.com _ Free PowerPoint Templates, Diagrams and Charts
컴퓨터 소프트웨어 설계 및 실험 년 1학기 실험계획 -.
Self Introduction Template PowerPoint
네트워크 환경 구축과 이미지 전송 호스트/타겟 통신 직렬 통신을 이용한 이미지 전송 수퍼 데몬 BOOTP 환경 구축
가상화 소개자료 02학번 이동신.
컴퓨터 소프트웨어 설계 및 실험 년 1학기 실험계획 -.
멀티미디어시스템 제 4 장. 멀티미디어 데이터베이스 정보환경 IT응용시스템공학과 김 형 진 교수.
Map Designer Solution 소개자료
프로그래밍 언어 학습을 위한 가상실습환경 창원대학교 이수현.
1장 C 언어의 개요 C 언어의 역사와 기원 C 언어의 특징 프로그램 과정 C 프로그램 구조 C 프로그램 예제.
학부 컴퓨터공학부 교육과정 (학부) 2학년 4학년 3학년 1학년 1학기 2학기 IPP 자격과정 전공트랙
Grid 시스템과 Globus ㈜ 클루닉스/기술부.
WISE OLAP.
K PaaS-TA 앱 운영.
JAVA 프로그래밍 16장 JNLP.
VAULT BASIC / VAULT PROFESSIOAL
리더 코딩 스토리 디자인 박찬준 이근영 박동현 박나영
Presentation transcript:

개발 환경 소개

빅데이터 분석을 위한 환경 빅데이터의 특징  Volume : 데이터의 양 (TB 부터 PB 정도의 데이터 )  Variety : 정형 / 비정형 / 반정형 데이터  Velocity : Streaming 성 데이터의 실시간 분석 빅데이터 분석을 위한 환경  강력한 인프라 : 많은 양의 데이터 빠른 처리 및 가시화를 위한 인프라  빅데이터 플랫폼  수집 : 3V 특징의 데이터를 수집 할 수 있어야 함  저장 : 대용량의 데이터를 효율적으로 저장 운용 할 수 있어야 함  처리 : 분석을 위한 전 / 후 처리가 빠르게 이루어져야 함  분석 : 기본적인 통계 분석 부터 인사이트 추출을 위한 고도화된 분석 기능도 제공  가시화 : 효과적인 가시화 기능을 통한 인사이트 추출  스케줄링 : 수많은 수집 / 저장 / 처리 / 분석 작업들을 효율적으로 관리  운영 : 인프라 부터 데이터 워크플로들에 대한 효율적인 운영 기능  보안 : 민감한 개인정보보호법 준수를 위한 다양한 보안 기능

빅데이터 분석 환경을 위한 인프라 빅데이터를 담기 위한 인프라 구축 시 고려사항  빅데이터를 담고 분석을 할 수 있는 인프라의 비용 최소화  많은 인프라가 안정적으로 돌아가기 위한 안정성 ( 모니터링 기능 필요 )  데이터양에 대한 불확실성을 커버 할 수 있는 유연성  장애에 대한 빠른 대처를 위한 민첩성 클라우드 컴퓨팅 등장 배경  전통적인 인프라 환경에서 새로운 서비스를 구축 할 때 HW 투자가 필연적이었음.  HW 투자 줄이기 위해 기존 서버 유휴자원을 사용하기 위한 가상화 기술을 개발하게 되었고 이를 활용한 선 투자비용을 줄일 수 있게 되었음.  가상화 기술을 통해 인프라 자원을 서비스화 했을 뿐 아니라 플랫폼과 소프트웨어까지 서비 스화 시켜 다양한 서비스 모델을 통해 가치 창출을 실현

클라우드 서비스 모델 Packaged Software : On-Premise 모델, 직접 인프라와 플랫폼, 어플리케이션을 관리 Infrastructure as a Service (IaaS) : 인프라 부터 OS 까지 서비스로 제공 Platform as a Service (PaaS) : 어플리케이션을 개발, 서비스 하기위해 사용가능한 서비스와 기능들이 제공되 는 클라우드 서비스를 의미 Software as a Service (SaaS) : 어플리케이션을 사용하는 관점에서 제공되는 IT 의 서비스 방식을 의미

PaaS 의 예

Aamazon Web Services 2006 년 부터 Public Cloud Service 를 시작 현재까지 Cloud Service 분야에서 독 보적인 존재 미국, 남미, 유럽, 호주, 일본, 싱가포 르, 한국 등 전세계 10 개 이상의 데이 터 센터 보유 약 250 여 개의 Cloud Service 제공 중

사용하게 될 서비스 Amazon CloudWatch 조별 서버 (C3.2xlarge) : 4EA 공용 개발서버 (C3.2xlarge) : 1EA 공용 서버 (t2.db.medium) : 1EA

빅데이터 플랫폼 Hadoop Ecosystem

모든 Open Source 의 특징 및 동작 원리에 대한 이해가 필요 Hadoop 의 경우, 아파치 재단의 버전과 사용 버전으로 나뉘어 지며 같은 이름이지만 Release 버전 및 배포판 성격에 따라 호환성도 모두 다르다. 수집기의 경우, 데이터 원천 시스템의 성격에 따라 네트워크 환경에 따라 사용되어야 하는 Open Source, 프로토콜이 전부 다르다. 프로젝트의 성격과 데이터의 특성에 따라 다르게 구성 프로젝트 성격상 실시간 분석이 들어가야 하는지 배치 분석으로 충족 되는지에 따라 들어가야 할 Open Source 및 플랫폼 구성이 달라진다. 폭넓은 시스템 관련 지식 필요 빅데이터 플랫폼의 성격에 부합하도록 시스템 구성 작업은 그 자체 만으로도 많은 지식이 필요하다. 프로그래밍 기술이 필요 Hadoop 을 사용할 때 반드시 필요한 Map-Reduce 형식의 프로그래밍은 일반적인 프로그래머들도 굉장히 힘들어한다. Hadoop Ecosystem 을 활용하려면..

빅데이터 플랫폼 구축 그 자체에 의미를 두기 보다, 이를 활용한 비즈니스 가치를 이끌어내는 것이 본질

Splunk Solution 소개 데이터 수집부터 저장, 검색 및 시각화 까지 전 과정을 지원 기 개발된 Contents(App) 제공 사용자 및 개발자를 위한 다양한 인터페이스 제공

Splunk 주요 기능 기능특징 수집 모든 데이터 형식 수집 지원 다양한 수집 방식 지원 ( 파일, Script, TCP/UDP, DB) 필요 시 별도의 Agent 개발 가능 수집 데이터 필터링 기능 지원 저장 정형 / 비정형 / 반정형 데이터 까지 처리 별도의 Parser 및 Schema 가 필요 없음 분산환경의 대용량 처리 가능 분석 다양한 처리 명령어 지원 대용량 Lookup 지원 Common Information Model 시각화 실시간 분석 및 시각화 지원 사용자 정의 대시보드 다양한 보고서 생성 Open source 와 연계 가능

분석 고도화를 위한 도구 Source :