Download presentation
Presentation is loading. Please wait.
1
2009, 46th KLA General Conference
추천시스템 기반 소셜네트워크 구축 사례 한국과학기술정보연구원 정보서비스실 이 상 기
2
CONTENTS 목차 추천시스템 및 소셜네트워크 개요 1 연구자연결망 소개 2 도서관 응용분야 3
3
1 추천시스템 및 소셜네트워크 개요
4
추천시스템(Recommender System)이란?
어떤 사용자와 특정 아이템이 주어졌을 때, 이 아이템에 대한 사용자의 선호도 (preference)를 예측 (prediction)하여 예상 선호도가 높은 아이템을 추천 (recommendation)하는 시스템 from KAIST 문화기술대학원, 안신현 정보를 필터링 (Information Filtering)하여 사용자에게 흥미로울 것 같은 정보 아이템을 제공하는 시스템 from KBS 방송기술위원회, 한성희 사용자들이 관심을 가질 것 같은 현재의 정보 아이템들 (영화, 음악, 뉴스, 책, 웹 페이지 등)을 나타내려하는 정보필터링 시스템 from 위키피디아 1990년 중반 이후 추천시스템은 Content-Based Recommendation과 Collaborative Filtering이 주류를 이루었으며, 현재는 후자에 관한 연구로 집중
5
추천목적 고객 속성 정보 상품 속성 정보 고객 고객 구매 이력 상품 판매 이력 추천의 목적 고객에게 관심 있는 정보 제공
. One-to-one marketing . 고객에게 차별화된 서비스 제공 . Enhance sales by Product recommendation, Cross-sell, Target advertisement 기본 개념 고객 속성 정보 고객에게 관심 있는 정보 제공 상품 속성 정보 고객 고객 구매 이력 상품 판매 이력 from Dept. of Computer Engineering, Dongguk University
6
추천프로세스 from KBS 방송기술위원회, 한성희 정보해석 정보 수집 새로운 정보 추출 추천정보 제공 data
추천정보 제공 data information Data collection Data Mining Application 명시적 수집 잠재적 수집 웹을 통한 정보수집 집단지성 베이지안 분류기 의사결정 트리 신경망 군집화 회귀분석 연관 규칙 학습 검색시스템 시장 예측 타겟 광고 개인맞춤서비스 콘텐츠 추천 from KBS 방송기술위원회, 한성희
7
추천모델 비교 추 천 방 식 추 천사 례 Non-Personalized Recommendation
사용자에게 특화된 평가와 추천을 제공하지 않음 ex) 영화 비평 사례를 조사하여 추천영화 서비스 등 Content-Based Recommendation 고객이 선택한 상품과 같은 키워드를 가진 상품을 추천 ex) 유사한 제목을 가진 책을 추천 Market-Basket Analysis 상품들 사이의 구매 상관관계를 근거로 구매자가 선택한 상품과 관련 있는 상품들을 추천 Collaborative Recommendation 상품에 대한 평가/구매를 근거로 유사한 고객을 찾아 유사한 고객이 구매한 상품을 추천 ex) Book Matcher of Amazon.com, My CDNOW Case-Based Reasoning(CBR) 속성이 유사한 고객(case)을 찾아 유사한 고객이 구매한 상품을 추천
8
Non-Personalized Recommendation
from Dept. of Computer Engineering, Dongguk University
9
Market-Basket Analysis
from Dept. of Computer Engineering, Dongguk University
10
Content-Based Recommendation
from Dept. of Computer Engineering, Dongguk University
11
Collaborative Recommendation
from Dept. of Computer Engineering, Dongguk University
12
Case-Based Reasoning(CBR)
from Dept. of Computer Engineering, Dongguk University
13
아마존 추천시스템 선택한 책을 구매했던 고객들이 구매한 다른 책들 또는 저자들을 추천
14
아마존 추천시스템 Book matcher 고객의 직접적인 feedback (rating) 기반 새로운 책 추천
15
아마존 추천모델 아마존 추천 특징 첫째, 상품 상호간의 유사도 관계에 근간한 추천, 시스템 내부에는 미리 계산된 상품들간의 Similarity Table 준비 둘째, 다양한 추천기능을 여러 곳에서 제공하고 있지만, 그 근간이 되는 아이디어는 매우 단순. 즉, 복잡하고 난해하며 인공지능적인 방법들을 사용하는 것이 아니라, 단순히 상품간의 유사도 관계를 바탕으로 해서 다양한 서비스 시나리오를 기획 셋째, 고객의 성향을 이해하기 보다는 고객의 실시간 관심사에 주목. 고객이 어떤 상품을 좋아할 것인가를 추론해내는 대신, 아마존을 이용하는 고객의 현재 관심상품. 즉, 상세보기 했던 상품, Wish List에 담은 상품, 장바구니에 담은 상품 등을 바탕으로 그것들과 어울려 판매되거나 또는 그것들을 대체할 만한 상품들을 추천
16
구글 추천모델 Alex Iskold의 4가지 추천방식 개인화된 추천 : 개개인의 과거행동에 기반한 추천
사회적 추천 : 비슷한 사용자의 과거행동에 기반한 추천 아이템 추천 : 아이템 자체에 기반한 추천 위의 세 가지를 결합한 추천방식 검색 알고리즘인 pagerank는 기본적으로 사회적 추천에 기반 아이템 추천 방식은 "Did you mean” 개인화된 추천서비스로는 뉴스 추천서비스가 있음
17
DailyMe 주요 특징 - 뉴스 분류를 4가지로 구분 : Category, Source, DailyMe Pick, Member Pick - Category : 익숙한 분류 방식인 정치, 경제, 국제 등 사용 - Source : 언론사별로 구분하는 방식 - DailyMe Pick : DailyMe 편집자가 제공하는 뉴스 카테고리 - Member Pick : 개별회원들이 선택한 뉴스를 마이페이지에 배치할 수 있도록 하는 분류 - 4가지 분류 방식에 따라 카테고리화된 뉴스를 각 개인은 선호도에 따라 마이페이지를 구성할 수 있음 통상적으로 이용자는 내가 보고 싶은 뉴스, 남들이 보는 뉴스, 편집자가 선택한 뉴스를 모두 원함
18
Last.fm 주요 특징 - 좋아하는 가수의 프로필, 인기곡 등을 볼 수 있고
- 누가 이 곡을 좋아하며 그들은 어떤 사람인지? - 취향이 비슷한 동료들이 최근에 이용한 노래는 무엇이며, 그들의 친구는 누군지 확인 가능
19
소셜네트워크 (Social Network)?
소셜 네트워킹 웹사이트란 온라인상에서 공통의 관심사를 가진 사용자 간의 관계 맺기를 지원하고, 축적된 지인관계를 통해 인맥관리, 정보공유 등 다양한 커뮤니티 활동을 할 수 있도록 하는 서비스를 말함. from KISTI, 이슈리포트 A social network is a social structure made of individuals (or organizations) called "nodes," which are tied (connected) by one or more specific types of interdependency, such as friendship, kinship, financial exchange, dislike, sexual relationships, or relationships of beliefs, knowledge or prestige from 위키피디아 학교별 웹 페이지에서 동창들이 함께 활동하는 집단 커뮤니티의 성격을 띄었지만, 개인의 친구 목록을 보여주는 기능을 제공하면서 개인과 개인 간의 ‘관계’라는 개념을 처음으로 도입하여 이를 축적할 수 있도록 한 동창 커뮤니티인 클래스메이트닷컴(Classmate.com)을 소셜 네트워크 서비스의 원조라 할 수 있음(1995년). 이후 본격적인 소셜 네트워킹 웹사이트들이 서비스를 시작하며 붐을 이룸
20
소셜네트워크와 커뮤니티 차이 소셜네트워크 - 개인이 중심이 되어 네트워크를 자유롭게 확장
- 주요기능은 프로필, 관계 맺기, 커뮤니케이션, 네트워크 활용, 콘텐츠 생산 및 공유 커뮤니티 - 그룹(카테고리)이 정해지고 개인이 참여하는 형태 - 주요기능은 커뮤니케이션 및 콘텐츠 생산 및 공유 1세대 소셜네트워크 - 프렌드스터, 오르쿠트 등, 주로 개인의 신상정보, 관심사, 소개정보가 담긴 프로필을 만들고 이를 통해 다른 사용자와 관계를 맺는 '지인 관계의 축적'에 집중하였으며, 초대에 의한 폐쇄적인 방식으로 접근 오프라인의 인맥 관계를 웹으로 구축하고 확장할 수 있게 한 1세대 소셜네트워크는 큰 인기를 끌었으나, 곧 새로운 성장동력을 찾지 못해 한동안 정체기를 맞음 2세대 소셜네트워크 - 마이스페이스가 대표적. 콘텐츠와 결합하여 축적된 관계의 ‘활용’에 집중하는 특성을 보임. - 폐쇄된 지인 간의 관계 맺기를 넘어, 축적된 관계를 적극적으로 활용하여 콘텐츠를 생산/공유/배포. 이러한 네트워크에 기반한 새로운 콘텐츠 유통시스템은 가입절차가 까다롭지 않고 콘텐츠 공유가 용이하여 사용자들의 지지를 받고 있음
21
국내외 대표 소셜네트워크서비스
22
소셜네트워크 트랜드 구글 소셜스트림 여러 소셜네트워크서비스를 한곳에 모아 Aggregator 역할. 이곳 저곳에 분산되어 있으면 불편하고 관리하기 어렵다
23
Reducing Complexity 소셜네트워크 트랜드
Our Social Networks can be understood at one glance Reduced Complexity through Simulation Analysis and Complex Theory for solving graphs Organization on Web
24
2 연구자연결망 소개
25
연구자연결망 컨셉 이용자 b 이용자 a 이용자 b 관련분야 연구자들의 전자원문 이용 즐겨찾기 등록 최신자료 인기자료 논문 A
이용자 c 이용자 d 이용자 c 이용자 d 원문복사 신청 알리미 서비스 <로그데이터 축적> <연구자연결망 구성>
26
관심DB 구축 TP_S_PROPOSALINFO (맞춤정보 저널/특허) TP_PROFILE (즐겨 찾는 저널/논문/특허/동향)
관심특허 구축모듈 관심저널 구축모듈 TR_SEARCH (논문 이용로그) gtb_mail (맞춤정보 동향) 관심특허 DB (IPC) 관심저널 DB TT_WEBLOG_SCRIPT (특허,동향 이용로그) TT_USER (개인 관심분야) 연구자연결망 DB D_PROPOSALINFO_NEW (DDS 신청데이터) 연구자연결망 생성모듈 관심분야 DB (과학기술표준분류) 관심분야 구축모듈 로그데이터 구축모듈 관심정보 원시데이터
27
연구자연결망 구축 프로세스 이용자 a 이용자 b 전자원문 이용 즐겨찾기 등록 논문 A 이용자 c 이용자 d 원문복사 신청
<개인별 관심정보> 논문 A <연구자연결망 DB> 이용자 c 이용자 d 원문복사 신청 알리미 서비스 <로그데이터 축적> <연구자연결망 XML파일> <연구자연결망 시각화>
28
연구자연결망 DB 구축현황 DB 구축현황 연계 현황 구 분 건 수 원문복사 235,883 건 즐겨찾기 205,963 건
논문 로그 1,906,944 건 특허/동향 로그 1,796,873 건 총 구축건수 4,145,688 건 이용자수 208,047 명 * NDSL이용자의 30% 수준 연계 현황 구 분 비 고 링크 건수 6,892,295 건 노드수(이용자) 181,191 건 * 제한 : 2건 이상
29
관련 분야 동료연구자들이 가장 많이 이용한 정보
나의 연구정보 관련 분야 동료연구자들이 최근 이용한 정보 관련 분야 동료연구자들이 가장 많이 이용한 정보
30
My 네트워크 이름 : 홍길동 소속기관 : KISTI 전공 : 컴퓨터공학 관심분야 : 전기/전자
오브젝트 내용 노드 크기 관련성 정도에 따라 크게 노드 색상 회원정보 공개여부에 따라 다르게 선 굵기 관련성 정도에 따라 굵게 선 색상 미적용 노드 모양 중앙만 아이콘으로 표현 이름 : 홍길동 소속기관 : KISTI 전공 : 컴퓨터공학 관심분야 : 전기/전자 이벤트 내용 노드이름 해당 연구자의 개인정보 보기 아이콘1 연구자연결망에서 제공하는 연구정보 보기 아이콘2 NDSL에 저자명으로 검색하기 노드클릭 해당 사람 중심으로 네트워크 재구성 선 마우스 나와 관련지수 표시
31
My Researcher 자기정보를 오픈한 회원만 신상정보 출력
32
발전방안 가중치 적용 TimeLine 적용 연구자연결망 기능개선 낮은 관계를 갖는 이용자 처리 동적 데이터 적용 IP를 이용한
원문복사신청, 원문클릭 등 이용자 이벤트에 가중치 적용 특허, 논문, 동향분석 등 DB별 가중치 적용 가중치 적용 연도별, 월별, 일별 등 타임라인에 따라 연결망 재구성 TimeLine 적용 아이템 단위에서 상위단계로 연결대상 확대 연구자연결망 기능개선 관심DB 업데이트 주기단축(현재 일일 단위) 낮은 관계를 갖는 이용자 처리 동적 데이터 적용 로그인하지 않는 이용자 식별방안 일반이용자가 아닌 관리자 로그데이터 식별방안 IP를 이용한 이용자 식별 관리자 로그정보 식별
33
발전방안 학술논문 공저자 적용 연구보고서 공저자 적용 연구자연결망 확장 My Researcher 추가 및 관리기능
학술논문의 공저자를 분석하여 연구자연결망에 추가 학술논문 공저자 적용 공동으로 연구하는 연구자 들을 연구자연결망에 적용 연구보고서 공저자 적용 연구자연결망 확장 연구자연결망에 수동으로 동료 연구자를 추가하거나 관리하는 기능 My Space 등 외부 소셜네트워크와 연계 My Researcher 추가 및 관리기능 외부 소셜네트워크와 연계
34
3 도서관 응용분야
35
검색 키워드 추천시스템 잘못 입력한 검색어와 가장 관련성이 높은 키워드 추천
36
검색 키워드 추천시스템 이용자들이 “건설”키워드 다음에 가장 많이 입력하는 검색어를 분석하여 추천검색어로 제시
37
유사문헌 추천 문서에 포함된 주제어, 제목, 초록 등으로부터 키워드를 추출한 후 이를 기반으로 문서간
유사도를 비교하여 가장 관련성이 높은 문헌 추천
38
협업을 통한 다양한 추천아이템 발굴
39
감·사·합·니·다 이상기
40
Q & A
Similar presentations