한국신뢰성학회 퀴즈 세션 주제 공지 제목 : 인터넷(포럼 , 동호회, SNS)에서 현대/기아/경쟁사 고객불만항목 정량화 및 발췌 목적 : 사외데이터를 활용하여 현대/기아/경쟁사의 고객불만사항을 발췌하고 숨어 있는 항목을 찾는 방법 필요 선정사유 : 인터넷 고객 불만 데이터 증가하여 고객 문제 분석 한계 고객불만사항 발췌 및 분석방법 필요 배경 : 현재 많은 분야에서 사외데이터 (인터넷, 동호회, SNS 등)을 통해서 고객의 고객불만을 발췌하고 숨어 있는 이슈를 발견하는 기술에 대해서 많은 관심을 가지고 있다. 빅데이터 분석 기술의 발달로 좀더 빠르고 쉽게 고객의 니즈를 찾을 수 있게 되었다. 구체적인 고객의 문제점을 파악하기 위해서는 텍스트 속의 불필요한 단어들을 제거하고 숨어 있는 중요한 단어들을 체계적으로 발췌할 수 있는 고도화 된 알고리즘 필요하다. 문제 : 본 퀴즈는 사외 고객불만데이터를 통해서 분석방법을 찾고 숨겨져 있는 고객불만을 발췌하는 것 이다. (첨부참조) 총 3가지의 항목에 대해서 평가하고자 한다. 1) 문서내 단어 중요도(가중치) 계산 방법 2) 탐색 알고리즘 (분석 방법) 3) 문제 발췌 주 > 단순 많은 빈도수의 단어를 중심으로 분석 제외 결과제출물 : 1) 문서내 단어 중요도(가중치) 계산 방법 2) 탐색 알고리즘 (분석 방법) 3) 문제 발췌 제공데이터 : 북미지역의 고객불만데이터 수집 ( 4항목 ) 평가항목 : 1) 단어 중요도(가중치 계산) 방법 2) 탐색 알고리즘 (방법) 3) 문제 발췌 (유의한) ( 30%, 30%, 40%)
한국신뢰성학회 퀴즈 세션 주제 공지 1) 사외데이터 입수 * 4가지 항목에 대한 고객 불만 내용 제공 새로운 방법 제시 ( 기존 : 많은 빈도의 단어를 중심으로 분석 이외 ) 2) 단어 중요도(가중치 계산) 방법 3) 탐색 알고리즘 (방법) * 주제 분석, 연관단어 탐색, 문맥 탐지 등 4) 문제 발췌 * 각 항목 별 문제 발췌 - 고객불만 -> 문제 발취 (원인/현상 등 포함) 5) 숨어 있는 이슈 발견 * 결과제출물 : 1) 문서내 단어 중요도(가중치) 계산 방법 2) 탐색 알고리즘 (분석 방법) 3) 문제 발췌