Skip to content

Content-based filtering

콘텐츠 기반 필터링(Content-based Filtering)은 해당 아이템의 도메인을 활용한 것으로 유저가 관심있는 아이템의 속성을 분석하여 새로운 아이템을 추천해주는 것입니다.

Collaborative Filtering (Item-based)와 다른 점은 다른 유저의 정보가 사용되지 않는다는 점입니다.

About

예를 들면, 내가 산 옷과 비슷하게 생긴 옷을 추천해주거나 뉴스 기사가 비슷하거나 관련된 다른 뉴스를 추천해주는 경우에 자주 사용됩니다.

이러한 콘텐츠 기반 필터링은 아이템들의 feature를 잘 추출하기 위한 TF-IDF (Term Frequency - Inverse Document Frequency)나 Word2Vec과 같은 Feature Extraction 방법론이 사용됩니다. 또한, 추출된 feature를 통해 아이템을 비교할 유사도(Similarity)에 대한 선택도 중요합니다.

  • 장점 : 유저의 선호도에 대한 정보 없이, 아이템 정보만으로 추천 가능
  • 단점 : 아이템을 설명할 수 있는 데이터(item's metadata) 구축이 필요.

Categories

  • TF-IDF
  • Word2Vec

Content-based filtering vs Collaborative filtering

Recommender system#Content-based filtering vs Collaborative filtering 항목 참조.

See also

Favorite site