Content-based filtering
콘텐츠 기반 필터링(Content-based Filtering)은 해당 아이템의 도메인을 활용한 것으로 유저가 관심있는 아이템의 속성을 분석하여 새로운 아이템을 추천해주는 것입니다.
Collaborative Filtering (Item-based)와 다른 점은 다른 유저의 정보가 사용되지 않는다는 점입니다.
About
예를 들면, 내가 산 옷과 비슷하게 생긴 옷을 추천해주거나 뉴스 기사가 비슷하거나 관련된 다른 뉴스를 추천해주는 경우에 자주 사용됩니다.
이러한 콘텐츠 기반 필터링은 아이템들의 feature를 잘 추출하기 위한 TF-IDF (Term Frequency - Inverse Document Frequency)나 Word2Vec과 같은 Feature Extraction 방법론이 사용됩니다. 또한, 추출된 feature를 통해 아이템을 비교할 유사도(Similarity)에 대한 선택도 중요합니다.
- 장점 : 유저의 선호도에 대한 정보 없이, 아이템 정보만으로 추천 가능
- 단점 : 아이템을 설명할 수 있는 데이터(item's metadata) 구축이 필요.
Categories
- TF-IDF
- Word2Vec
Content-based filtering vs Collaborative filtering
Recommender system#Content-based filtering vs Collaborative filtering 항목 참조.
See also
- Recommender system (추천 시스템)
- Content-based filtering (컨텐츠 기반 필터링)
- Collaborative filtering (협업 필터링)
- Hybrid recommender systems
- Learning to rank (machine-learned ranking; MLR; 순위 학습)
- Similarity (유사도)