김병곤 / fharenheit@gmail.com Flamingo Community Meetup Flamingo 소개 김병곤 / fharenheit@gmail.com.

Slides:



Advertisements
Similar presentations
CI(Continuous Integration) 이학성. C ontinuous I ntegration? 2 지속적으로 품질관리 를 적용하는 과정 개발자가 기존 코드의 수정 작업 을 시작할 때, 코드 베이스의복사본을 받아서 작업을 시작하면서 코드의 변경.
Advertisements

개발 환경 소개. 빅데이터 분석을 위한 환경 빅데이터의 특징  Volume : 데이터의 양 (TB 부터 PB 정도의 데이터 )  Variety : 정형 / 비정형 / 반정형 데이터  Velocity : Streaming 성 데이터의 실시간 분석 빅데이터 분석을 위한.
UX, RIA, 그리고 … Silverlight 공도소프트
공공기관을 위한 단일 개발 환경 Visual Studio 솔루션 개요 주요 기능 구축사례 제품 정보 및 문의.
1 08 시스템 구성도 고려사항 * 웹 서버 클러스터 구성  클러스터 구축은 ㈜ 클루닉스의 Encluster 로 구축 (KT 인증,IT 인증 획득, 실제 클러스터 구축 사이트 200 여곳 )  웹 서버 클러스터는 Dynamic, Static, Image.
WCL 이민학 Big Data & Hadoop.
한국클라우드서비스협회 ▶ 제키톡 서비스 - 제키톡 서비스 ∙ 안드로이드 기반의 모바일 무료 메시지, 무전기, 채팅 어플리케이션으로 국내뿐만 아니라 전세계 대상으로 서비스 제공 중 ∙ 현재 안드로이드폰을 대상으로 서비스 중이며, 아이폰을.
Big Data & Hadoop. 1. Data Type by Sectors Expected Value using Big Data.
2008 년 11 월 20 일 실습.  실험제목 ◦ 데이터베이스 커넥션 풀  목표 ◦ 데이터베이스 커넥션 풀의 사용.
2016 유성환 Hybrid MOBILE.
The Value Chain of Telecommunications Service
목 차 C# 언어 특징 .NET 프레임워크 C# 콘솔 프로그램 C# 윈도우 프로그램 실습 프로그래밍세미나 2.
Security Solutions (S/W) - Fortify
컴퓨터공학과 김소원.
Oozie Web API 기능 테스트 이승엽.
- 세부 1 - 이종 클라우드 플랫폼 데이터 관리 브로커 연구 및 개발
Data Interface, Data mart Technology
뇌를 자극하는 Windows Server 2012 R2
2014 CnO Conference 민간주도 Open PaaS 오픈 클라우드 엔진
빅데이터 분산 처리 시스템 충북대학교 정보통신공학부 복경수
Power Java 제3장 이클립스 사용하기.
1. Windows Server 2003의 역사 개인용 Windows의 발전 과정
BIG Data 컴퓨터응용과학부 박진완.
Windows Server 장. Windows Server 2008 개요.
Sep Youn-Hee Han 웹서비스 컴퓨팅 수업을 위한 코딩 환경 준비 Sep Youn-Hee Han
데이터웨어하우스
Advanced Data Analytics 데이터분석 전문가
Korea University of Technology and Education Hongyeon Kim
1. 컴포넌트 개요 – [빅데이터] 기능 개요 컴포넌트 기능 구성도 주요 기능 정의 JDBC Interface 데이터 가공제공
DAG 기반 분산 스트림 처리 기술 V1.0 ETRI Technology Marketing Strategy
뇌를 자극하는 SQL Server 장. SQL Server 2008 소개.
Visual Basic .NET 처음 사용하기.
Capstone-Design : IoTeam Introduction Abstract
FTP 프로그램 채계화 박재은 박수민.
게임에서 공공까지, 국내 실 사례들로 본 빅데이터 융합 분석
                              데이터베이스 프로그래밍 (소프트웨어 개발 트랙)                               퍼스널 오라클 9i 인스톨.
HDFS와 대용량 데이터 처리 콘텐츠서비스연구팀 최완.
뇌를 자극하는 Windows Server 장. Windows Server 2008 개요.
Chapter 03 : 서블릿 ( Servlet ) 개요. chapter 03 : 서블릿 ( Servlet ) 개요.
Wireless Java Programming
아틱 기반 전력 통합 모니터링 시스템 검증을 위한
2018 Fasoo Projectship Project List.
HTTP 프로토콜의 요청과 응답 동작을 이해한다. 서블릿 및 JSP 를 알아보고 역할을 이해한다.
EAI 구현 사례 : A사 System Architecture
뇌를 자극하는 Windows Server 장. 원격 접속 서버.
DataScience Lab. 박사과정 김희찬 (목)
웹디자인
AUTODESK AUTOCAD ELECTRICAL 전기제어 2D 설계 소프트웨어 표준기반 설계 생산성 도구 구조도 설계
LabVIEW WiznTec 주임 박명대 1.
컴퓨터 소프트웨어 설계 및 실험 년 1학기 실험계획 -.
Self Introduction Template PowerPoint
STS 에서 웹 서버 설치 방법.
Level 0 Level 1 Level 2 Level 3 공모전 후기 모음 웹 서비스 1. 웹 페이지 설계 2. 웹 서버 구현
클러스터 시스템에서 효과적인 미디어 트랜스코딩 부하분산 정책
암호학 응용 Applied cryptography
컴퓨터 소프트웨어 설계 및 실험 년 1학기 실험계획 -.
한양대학교 Mobile Cloud Service Syllabus
웹 애플리케이션 보안 Trend 인포섹㈜ 신수정 상무
Map Designer Solution 소개자료
08. 소프트웨어 아키텍처 설계 전략 명지대학교 융합소프트웨어학부 김정호 교수.
슬라이드 쇼의 설정 슬라이드 쇼의 실행 파일과 폴더의 관리 글꼴을 포함해서 저장 웹 페이지로 게시 압축 파일
Red Hat OpenShift Container Platform
Grid 시스템과 Globus ㈜ 클루닉스/기술부.
WISE OLAP.
프로젝트 개요 OPENSTACK을 이용한 교육용 CLOUD 환경 구축! 교수님(관리자)와 학생(이용자)으로 구분.
학부생 연구원 및 대학원생 모집 DataBio 연구실 (윤영미 교수님) 연구실 소개 연구 과제 모집 대상 혜택 모집 기간
M.B.TEAM 중간 발표 (5.18) 이 제걸 백 인호.
K PaaS-TA 앱 운영.
VAULT BASIC / VAULT PROFESSIOAL
디지털광고 구동 원리 전중달 CTO.
Presentation transcript:

김병곤 / fharenheit@gmail.com Flamingo Community Meetup Flamingo 소개 김병곤 / fharenheit@gmail.com

Flamingo는 어떻게 시작되었나? Apache Hadoop을 이용하는 빅데이터 프로젝트들이 대부분 개발 생산성이 낮고 개발부터 운영까지 수작업으로 진행하는 경우가 너무 많아서 개발 비용이 증가하게 됩니다. Apache Hadoop EcoSystem을 위한 하둡 인프라를 지원하는 플랫폼 SW 필요 2. 확장 및 저비용 구조를 위한 오픈소스 라이선스 적용 필요 3. 과도하게 낮은 생산성 생산성 향상을 위한 분석 도구의 기능 필요 1. 클라우드 환경을 위한 웹 기반 분석 환경 제공 필요 4. 일반 개발과 동일한 비용 초보적인 개발 환경 “데이터 중심 프로젝트를 일반 홈페이지 개발 프로젝트와 유사하고 진행” “유닉스 개발환경과 유사한 현재의 개발 환경” 개발 도구의 부족으로 인한 단순 반복 작업 증가 데이터 플랫폼의 특성상 보안이 엄격한 환경에서 작업을 하는데 있어서 시스템에 접근 제한 발생 데이터 검수에 많은 시간이 소요 자동화 과정을 수작업으로 개발하는 상황 개발자와 분석가를 분리하지 못하는 개발 체계 알고리즘의 자산화가 어려운 시스템

Flamingo Monitoring Flamingo는 HTML 5 기반으로 Apache Hadoop EcoSystem을 위한 데이터 분석/처리/개발/운영 환경을 제공하며 MapReduce 분석 알고리즘, Hadoop Job 분석 및 모니터링, Hive Metastore 관리, 워크플로우 관리 기능을 제공합니다. 제공 기능 목록 20 여종 이상의 고속 병렬 처리 MapReduce 알고리즘 빅데이터 인프라 모니터링 빅데이터 분석 플로우 모니터링 빅데이터 분석 작업 모니터링 빅데이터 로그 관리 분석 플로우 배치 작업 관리 고속 병렬 질의 엔진 빅데이터 기반 데이터웨어하우스 관리 라이센스 Apache License 2 시스템 요구사항 Linux 64 bit Java 7 이상 / MySQL 5.x 이상 Apache Hadoop 2.3 이상 R 3.0 이상 / ggplot 2 이상 Hive 0.14 이상

Flamingo Workflow Designer Flamingo는 웹 기반 분석도구로 플랫폼 SW를 구현하고 개발한 MapReduce 분석 알고리즘을 워크플로우 디자이너 자유롭게 분석에 활용할 수 있어서 분석 알고리즘을 자산화할 수 있습니다. 상세 내용 1 1 기본으로 제공하는 다양한 분석 모듈 - 머신러닝 알고리즘, Spark - ETL, Java, MR, Hive, Pig, R 2 각 분석 및 처리 모듈은 동작에 필요한 각종 파라미터를 제공하고 사용자는 UI에서 수정하여 적용 2 주요 특징 기 작성한 알고리즘 및 데이터 처리/분석 모듈을 손쉽게 디자이너와 통합 Hadoop API 따라 개발된 경우 기 개발한 모듈의 변경없이 디자이너와 통합

Flamingo Big Data Platform Flamingo Architecture Flamingo는 국내에서 개발하고 있는 Tajo, Ankus를 포함하여 Hadoop EcoSystem을 지원하기 위한 모든 것을 준비하고 있습니다. Apache Spark Flamingo Big Data Platform Apache Spark HDFS Browser Apache Hive Management Pig Latin Editor Batch Job Management HDFS Audit RStudio/R Monitoring Workflow Pivotal HAWQ Management HDFS Log Apache Tajo Management Apache Spark Agent RHive RHadoop Flamingo Collector MR ETL MR Algorithm Apache Kafka Apache Hive Resource Manager Namenode Datanode Apache Kafka Hive Server 2 Resource Manager Application Master Data Node Name Node Apache ZooKeeper Node Manager Hive Metastore Resource Manager Agent Namenode Agent Apache Kafka Agent Map/Reduce Task

Github Repository

Messenger for Developer (Slack) flamingo-dev-team.slack.com

Flamingo Project Flamingo (FL) Flamingo Analytics (FEA) Flamingo Managment (FEM) 구분 Flamingo Enterprise for Analytics (OpenSource) Flamingo Community (OpenSource) Flamingo Enterprise for Management (Commercial) 구 성 요 소 워크플로우 디자이너 for Oozie 워크플로우 디자이너 for Oozie Apache Oozie 모니터링 Apache Oozie 모니터링 Apache Oozie 모니터링 Apache ZooKeeper 모니터링 분석 애플리케이션 모니터링 (YARN, MapReduce, Spark 등) 분석 애플리케이션 모니터링 (YARN, MapReduce, Spark 등) HDFS 브라우저 HDFS 브라우저 리포팅 Apache Hive 개발 및 관리 HAWQ 개발 및 관리 Hive 모니터링 애플리케이션 성능 분석 Pig 개발 및 관리 Deep Learning Pack 리얼타임 정보 수집 클러스터 관리 웹 터미널 ETL Pack HDFS Browse Audit HDFS Audit HDFS 브라우저 Machine Learning Pack 마스터노드 모니터링 서버 리소스 모니터링 Tajo 개발 및 관리 기본 모니터링 Pack Kafka, Flume, Storm, MapR, HAWQ, Greenplum, Spring XD 모니터링 Spark Workflow Designer