게임에서 공공까지, 국내 실 사례들로 본 빅데이터 융합 분석 게임에서 공공까지, 국내 실 사례들로 본 빅데이터 융합 분석 ㈜위세아이텍 안 동 혁
목차 헬스케어 사례 게임산업 사례 제조산업 사례 공공정보 개방 캠페인 관리 SNS 분석 데이터의 융합 – 정형 & 비정형 플랫폼의 융합 – 하둡 & 어플라이언스 & 인메모리 & 클라우드 분석 방식의 융합 – 다차원분석 & 검색 & 통계/마이닝 & 최적화 & 시각화, 어크로스큐브 분석과 엑셀 리포팅
빅데이터 융합 데이터의 융합 조화로운 융합 플랫폼의 융합 분석방법의 융합 데이터의 융합 – 정형 & 비정형 플랫폼의 융합 – 하둡 & 어플라이언스 & 인메모리 & 클라우드 분석 방식의 융합 – 다차원분석 & 검색 & 통계/마이닝 & 최적화 & 시각화, 어크로스큐브 분석과 엑셀 리포팅
1. 헬스케어 사례 다양한 유형의 데이터 융합을 통해 가치 있는 정보를 사용자에게 제공 심박(HR) 호흡(Resp) 영상(Video) 음색(Voice) 원격 바이오 레이더 센서 평균온도 : 29.72도 최고온도 : 31.03도 최저온도 : 23.97도 온도분포 : 23.97도 공간융합센서 모듈
2. 게임산업 사례 게임 분석 DW 분석 Tool 게임서버A 아이템분석 사용자정보 사용자분석 케릭터정보 캐릭터분석 결제정보 결제분석 게임서버B Data warehouse Analysis cubes ETL Data marts 빌링서버 계정서버
글로벌 게임 데이터 수집 한국 한국 유럽 미주 유럽 미주 클라우드로 글로벌 빅데이터 통합 Cloud 홍콩 Cloud 빠르다 Cloud 홍콩 매우 빠르다 매우 빠르다 Cloud 유럽 Data 전송이 느리고 자주 끊긴다 Cloud 미주 유럽 미주 빠르다 빠르다 유럽 미주
글로벌 게임사의 빅데이터 융합 글로벌 클라우드로 빅데이터를 수집 로그성 데이터는 하둡으로 정규데이터는 RDB와 인메모리 활용 Cloud Storage 지역별 게임 서비스 데이터 RDB DW Cube HDFS Hive DW 정형데이터 Log In-Memory Mart SaaS BI OLAP EIS SNS Mart Social Analytics Global Public Cloud Public Cloud BI HDFS : Hadoop Distributed File System SaaS : Software as a Service
융합 플랫폼의 장점 패키지 구매 방식 대비 훨씬 저렴한 비용 특정 제품에 종속적이지 않은 구조 구축 부담 없이 SNS 데이터를 분석 서버 구매 방식 대비 훨씬 유연한 확장
3. 제조산업 사례 대용량 데이터 분석을 위해 클라우드 환경에서 RDB 기반의 BI를 구성 글로벌 클라우드를 적용하고 테스트함 Global Public Cloud 2 Global Public Cloud 1 로그생성과 저장 ODS 기업 시스템 매출, 서비스 메타데이터 DW Mart OLAP Reporting ODS : Operational Data Store DW : Data Warehouse OLAP : On-Line Analytical Processing Business Intelligence
빅데이터 아키텍처 개선 전통적 BI 구조의 보완 및 개선 클라우드 환경에서 아키텍처 변경 Global Public Cloud 통합 전통적 BI구조 유지 인메모리 적용 Hadoop 도입
글로벌 퍼블릭 클라우드 활용 데이터 보관 보안 확장 변화 대처 데이터 저장 뿐만 아니라 2중 백업을 지원 퍼블릭 클라우드에서 이미 보안은 검증됨 데이터가 빠르게 증가하고 증가세를 산정하기 어려운 곳에서는 확장이 가능한 퍼블릭 클라우드가 유리 클라우드에서는 아키텍처 변경도 유연 데이터 증가에 대한 유연한 대처 데이터 이중 백업 (다른 대륙에 위치한 IDC에 백업) 보안 위험성 낮음 (특히 DDoS) 플랫폼 변경에 유연 (Hadoop 적용, 고성능 업그레이드 등)
4. 공공정보 개방 서울시 공공 DB 활용을 위한 데이터 관리 인프라 구축
서울시청 사례 공공데이터의 적극적 활용을 목표로 현재 20종에서 2014년까지 150종을 개방
공공정보 개방 구조
Campaign Management System 5. 캠페인 관리 규모증가 대상 고객, 캠페인 프로그램, 대고객 채널의 증가 이들의 조합으로 발생하는 캠페인 데이터 증폭 최적화 반응과 ROI 예측에 따른 캠페인 최적화 요구 더 복잡해지고 늘어난 캠페인 성과분석 데이터 Campaign Mart Campaign Management System 캠페인 고객 Mart 성과분석 Mart 오퍼관리 승인결재관리 정산관리 대고객 캠페인 메시지 전달 채널 운영계 정보계(DW) 채널연계 (Web Service) 반응 수집 영업 시스템 연계 오퍼 실행 채널
캠페인성과 분석 Hadoop Dashboard OLAP Reporting 데이터저장 HDFS Data Mart Hive 고객 반응 모니터링 Map/Reduce Sqoop SQL HQL 캠페인 성과 성과분석 Cube Dashboard OLAP Reporting 성과분석 Mart RDBMS
캠페인성과 분석 캠페인 반응 또는 운영 모니터링 로그와 같은 단순하면서도 대용량인 데이터는 Hadoop 활용 성능을 위해서 Appliance, In-Memory 적용 요약성이고 마스터데이터와 결합도가 높은 데이터는 기존 RDB 방식 활용 캠페인 반응 또는 운영 모니터링 로그와 같은 단순하면서도 대용량인 데이터는 Hadoop 활용
원투원 마케팅 실현 원투원 채널 매칭 캠페인 반응 성과와 선호 관련 빅데이터를 분석 고객별로 선호하고 성과가 높은 상품을 매칭 예상 고객의 과거 데이터를 근거로 예상 반응과 성과를 예측
6. SNS 분석 SNS 비정형 데이터와 고객 정보가 융합된 빅데이터 분석 API 최적 대상고객 선정 SNS 캠페인 실행 Twitter Facebook … API 키워드 분석 기업보유 데이터 회원, 실적, 상품, 캠페인 SNS 분석 데이터 SNS 고객 프로파일링 정형 데이터 Id, Name, follow수, 좋아요.카운트, … 비정형 데이터 작성글 소셜 미디어 분석 SNS 채널 캠페인 최적 대상고객 선정 캠페인 실행 마케팅 메시지 ※ 출처 : 김종현, “빅데이터 분석 기반의 SNS 고객선정 프로파일링 모델에 대한 실증적 연구”, 2012
Cloud BI - Social Analytics Service Cloud 환경의 SNS 분석 미디어 홍보 시 얼마나 반응이 있는지를 SNS 데이터로 추정 클라우드 서비스에서 필요 항목만 입력 Cloud BI - Social Analytics Service 주제, 키워드, 수집기간 SNS 데이터 수집 굳이 외부 데이터를 수집, 저장할 필요 없이 분석결과만 수신 SNS 데이터 분석 SNS 분석 정보 데이터 수신
SNS 채널 캠페인 SNS고객은 1차적으로 기업의 회원 내지 직접적인 고객이 아니라 특정 관심 사항에 따른 그룹 멤버들 비회원이라도 우리의 회원과 소셜 네트워크로 연결되어 있다면 마케팅 메시지를 타겟 고객에게 전달할 수 있음 SNS 채널 캠페인 캠페인 대상자에게 SNS 캠페인 메시지를 전달 캠페인 대상자 비대상자