Flexible Recommendation Framework Sangkeun Lee IDS Lab. Seoul National University
Copyright 2010 by CEBT 공통점 찾아보기 2 추천 시스템을 서비스에 이용하고 있는 Commercial & non-commercial 사례
Copyright 2010 by CEBT 추천 시스템 (Recommender System/Engines) 3 Recommender systems or recommendation engines form or work from a specific type of information filtering system technique that attempts to recommend information items that are likely to be of interest to the user. (from Wikipedia)information filtering system Variety of Services Amazon, Amie Street, Barilliance, Barnes and Noble, Baynote, ChoiceStream, Collarity, Digg.com, eBay, Google, News, Gravity, R&D, half.ebay.com, Heeii, Hollywood, Video, Hulu, iLike, Internet Movie Database, iTunes, Last.fm, LibraryThing, Loomia, Musicmatch, MyStrands, Netflix, Simania,…… Variety of Domains films, television, video on demand, music, books, news, images, web pages, etc 영화 웹사이트 문서 책 음악
Copyright 2010 by CEBT 모든 것이 좋아 보이나 … 4 Lack of Data – need a lot of data to effectively make recommendations – a chicken and egg problem - to get good recommendations, you need a lot of users Changing Data – biased towards the old and have difficulty showing new – each attribute (think fit, price, color, style, fabric, brand, etc) has a different level of importance at different times for the same consumer Changing User Preferences – today I have a particular intention when browsing e.g. Amazon - tomorrow I might have a different intention Unpredictable Items – The type of movie that people either love or hate This Stuff is Complex! – it takes a lot of variables to do even the simplest recommendations – find the magic formula for recommending new products or content to their users…?? ReadWriteWeb – ‘5 Problems of Recommender Systems’ (
Copyright 2010 by CEBT Finding the Magic Formula? ‘ 최적의 추천 공식 ’ – 즉, 사용자의 만족도를 가장 높여 줄 수 있는 추천 알고리즘과 파 라메터를 찾는 것은 결코 쉬운 일이 아니다. 시간의 흐름에 따라 데이터는 지속적으로 변화한다 추천을 위한 속성의 중요도가 변화한다 사용자마다 다른 추천 기법이 최적일 수 있다. 추천에 활용할 수 있는 변수들은 너무도 많다. 다양한 추천 알고리즘들이 존재한다 상황에 따라 다른 성능을 보인다 Amazon 이나 Netflix, Google 같은 많은 사용자를 확보하고 있는 대표 서비스들을 제외 하고는 많은 추천 서비스들이 만족스러운 결과를 얻는 데 필요한 그들만의 공식을 찾 는 것이 어려운 것이 현실이다 ( 추천 시스템의 가장 성공적인 Case 로 꼽히는 Netflix 또한 추천 정확도의 10% 향상을 위한 Netflix Prize 을 개최하고 있다.) 5
Copyright 2010 by CEBT Flexible Recommendation Framework 최적 솔루션을 찾기 위한 Empirical Experiment 를 할 수 있어야 한다 다양한 추천 알고리즘들의 Dynamic 하게 속성별 중요도를 조정해가면서 결과를 비교 분 석 할 수 있도록 하는 실험이 가능하다면 경험적으로 (Empirically) 최적의 솔루션을 찾는 데 도움이 될 것이다. 그러나 대부분의 추천 시스템은 Hardly-wired recommendation algorithm 을 이용해 추천 서비스를 제공한다. – 실험이나 파라메터의 변경, 새로운 추천 기법의 도입을 위해 Code-level 의 수정이 필요하다. – 정해진 데이터 스키마 구조를 가정하고 있어서 유연하지 않으며 low-level 데이터의 구조를 이해 해야 추천 알고리즘을 변경 할 수 있다. Flexible Recommendation Framework 가 필요하다 Related Works Multidimensional Recommender Systems: A Data Warehousing Approach – RQL: formulated on a pre-specified multidimensional cube of ratings FlexRecs – a general and open framework for expressing and pro- cessing flexible recommendations over relational data 6
Copyright 2010 by CEBT 7
8
Goal of Flexible Recommendation Framework Two types of relations - Atomic, Composed Atomic relations are pre-calculated from low-level log data (Code Level) Composed relations are calculated by composing atomic relations (System Level) By combining relations, (any) recommendation algorithms can be declaratively defined without understanding low-level log data Expected Contributions Dynamic 하게 Relation 들을 넣고 빼고 결과를 보면서 추천 알고리즘을 테스트 할 수 있 다. Coding Skill 이나 Computer Engineering 에 대한 깊은 이해가 없는 사람이라고 할지라도 의미 기반의 추천 알고리즘을 작성하고 테스트 할 수 있다. 재사용 가능한 의미 단위의 Building Block 을 활용함으로써 Code 를 새로 작성하는 것을 최소화 한다. 데이터의 구조를 변경하지 않고 새로운 추천 알고리즘의 결과를 실험해볼 수 있다. (on the fly) 여러 가지 추천 알고리즘의 결과를 쉽게 Blend 할 수 있다. 어떤 것이라도 추천의 대상이 될 수 있다. (multiple-dimensions) 9