리더 코딩 스토리 디자인 박찬준 이근영 박동현 박나영 팀명 : 옵션(option) 리더 코딩 스토리 디자인 박찬준 이근영 박동현 박나영
Big Data
빅데이터란?? 기존에는 대용량 데이터 자체를 의미하였으나, 대용량 데이터를 이용하여 정보를 수집, 발굴, 분석하는 개념까지 확대되어, 개인화된 비정형 데이터를 말한다. 비정형 데이터란?? 기존의 기업의 매출액, 개인의 나이나 성별처럼 구조화 된 데이터가 아니라, 텍스트, 음성, 영상, 문자메시지 등의 다양한 유형의 데이터를 말한다.
빅데이터의 분류
비정형 데이터와 반정형 데이터의 예
빅데이터의 특징3가지 데이터 양(volume) 데이터 속도(velocity) 데이터 다양성(variety)
기존 데이터와의 차이점 빠른 의사결정이 상대적으로 덜 요구된다. 처리 복잡도가 높다. 처리할 데이터양이 방대하다 비정형 데이터의 비중이 높다. 처리/분석 유연성이 높다. 동시처리량이 낮다.
빅데이터의 특징 그래프
빅 데이터 분석 기술 Text Mining : 텍스트 마이닝은 비/반정형 텍스트 데이 터에서 자연 언어 처리 기술에 기반하여 유용한 정보를 추출, 가공하는 것을 목적으로 하는 기술이다. 평판 분석 : 오피니언 마이닝은 소셜미디어 등의 정형/비 정형 텍스트의 긍정, 부정, 중립의 선호도를 판별하는 기 술이다. 소셜 네트워크 분석 : 소셜 네트워크 분석은 소셜 네트워 크 연결구조 및 연결강도 등을 바탕으로 사용자의 명성 및 영향력을 측정하는 기술이다. 군집 분석 : 군집 분석은 비슷한 특성을 가진 개체를 합 쳐가면서 최종적으로 유사 특성의 군을 발굴하는데 사용 된다.
대규모의 정형/비정형 데이터를 처리하는 데 있어 가장 기본적인 분석 인프라로 하둡이 있으며, 데이터를 유연하 고 더욱 빠르게 처리하기 위해 NoSQL 기술이 활용되기 도 한다. 빅 데이터 표현 기술 빅 데이터 분석 기술을 통해 분석된 데이터의 의미와 가 치를 시각적으로 표현하기 위한 기술로써, R (프로그래밍 언어)이 대표적이다.
하둡기술 데이터는 그 자료를 처리할 수 있는 컴퓨터클러스터 를 통해 분산처리하여 원하는 결과를 빠르게 처리해 주는것 입니다.
끝♥