추천시스템의 분류
어떤 요건에 맞춰 어떤 데이터를 활용하여 어떤 모델을 이용하여 어떤 방식으로 계량 할 것인가?
요건
- 베스트 셀러
- 관련 상품
- 맞춤 추천
- 특정 상황
베스트 추천
관련 추천
개인화 추천
Feedback 데이터에 따른 분류
Explicit Feedback
- 사용자의 아이템에 대한 명시적 선호 정보를 가진 이력
- 1점~10점
- 만족/보통/불만족
- 선호 데이터 수집의 어려움
Implicit Feedback
- 사용자의 아이템에 대한 암시적 선호 정보를 가진 이력
- 조회/ 구매/ 시청/ 머무른 시간
- 사용자의 아이템에 대한 선호도를 명확히 알기 힘들다.
Explicit과 Implicit 는 서로 변환 가능하다.
행위 이력으로 Rating 추정
- 끝까지 본 영화는 높은 평점으로
- 도중에 끄면 낮은 평점
- 자주 사용한 APP 높은 평점
- 적게 사용한 APP 낮은 평점
Rating을 행위 이력으로 변환
- rating이 높은 책 -> 구매 O
- rating이 낮은 책 -> 구매 X
추천시스템 모델에 따른 분류
- 아이템 인기도
- 아이템, 아이템 유사도
- 사용자, 아이템 선호도
- 사용자, 사용자 유사도
BEST 추천
- 인기도가 높은 아이템 추천
관계 추천
- 주어진 아이템과 유사도가 높은 아이템 추천
맞춤 추천
- 사용자의 선호도가 높은 아이템 추천
- 사용자와 유사한 사용자들이 선호하는 아이템 추천
유사도/선호도 계산 방법
- 아이템 속성을 이용
- 사용자 행동 이력을 이용
계량 방식에 따른 분류: 점수 예측
- 사용자의 아이템에 대한 선호 점수를 예측, 선호 점수가 높은 아이템을 추천
점수 예측 대표 사례
넷플릭스 대회
영화에 대한 유저들의 평가를 예측하는 최상의 Collaborative Filtering 알고리즘을 가려내는 콘테스트
- 영화나 유저에 관한 다른 정보 하나 없이 앞선 유저들의 평가만을 기반으로 알고리즘을 짬
- RMSE = 0.9514
Matrix Completion Problem
계량 방식에 따른 분류: Top-K 추천
- 선호 점수에 기반한 아이템의 순위를 중요시
- 선호 점수를 잘 예측할 필요 X
'추천시스템(RS)' 카테고리의 다른 글
CBF 기반 예측 (0) | 2022.07.11 |
---|---|
MovieLens Dataset (0) | 2022.07.11 |
추천시스템 고려사항 (0) | 2022.07.11 |
추천시스템 성능 평가 (0) | 2022.07.11 |
추천시스템 개요 (0) | 2022.07.11 |