【레코멘드】내용 베이스 필터링과 협조 필터링

추천 시스템 정보



추천 시스템이란, 이용자에게 있어 유일하다고 생각되는 대상, 정보, 또는 상품 등을 선택해,
그것을 이자의 합리적인 형태로 제시하는 시스템입니다. 최근에는 아마존을 비롯한 많은 웹 서비스로 구현되어 왔으며 많은 사람들에게 친숙해졌습니다.

Amazon 등에서는 복잡한 알고리즘을 복수 조합해 추천 시스템을 구축하고 있는 것 같습니다만, 이번은 추천을 실시할 때에 기초가 되는 내용 베이스 필터링과 협조 필터링에 대해 정리합니다.

콘텐츠 기반 필터링



한 사용자가 구매한 상품의 태그 정보에서 유사한 상품을 찾아 추천하는 방식입니다.
사용자가 구매한 제품의 태그 정보를 바탕으로 사용자가 어떤 분야에 관심이 있는지 축적하고 유사한 상품을 찾아 제안합니다.



이 방식에서는 태그 정보를 바탕으로 다양한 추천을 할 수 있는 한편, 추천하고 싶은 상품에는 반드시 태그를 붙여야 한다는 단점이 있습니다. 예를 들어 위 이미지에 있는 '입문 Python3'은 상품 등록 시 태그 '#python'을 붙여 다른 Python 관계의 책이 판매된 후에 추천됩니다. 태그 '#python'이 없으면 추천되지 않습니다.
또한 원래 태그 "#python"이 적절한지 여부도 생각해야합니다. 사용자의 취향을 고려한 뒤 치밀한 마케팅을 실시하여 태그를 설계해야 합니다.
따라서 콘텐츠 기반 필터링은 시간과 비용이 많이 든다는 특성이 있습니다.

협력 필터링



사용자의 이동 이력 등을 바탕으로 구매 패턴이 가까운 사용자를 찾아 상품을 추천합니다. 이때 아이템의 성질, 태그 정보 등은 전혀 고려하지 않는 특징이 있습니다.



위 이미지에서는, 우선 각 상품에는 태그가 붙어 있지 않습니다. DB에도 각 사용자가 과거에 어떤 상품을 샀는지 정보를 기록합니다. 그리고 사용자별 구매 내역에서 유사성이 높은 사용자를 선택합니다. (예에서는 유사 사용자는 한 명만 선택되어야 한다)
결과적으로, A씨와 구입 취향이 가까운 D씨가 과거에 구입한 상품이 A씨에게 추천됩니다. 사용자의 구매 내역을 축으로 하기 때문에 각 상품의 태그 정보는 필요하지 않습니다.

그러나 협력 필터링에서는 누구에게도 구입되지 않은 상품은 추천되지 않는 등 큰 단점이 있습니다.

하이브리드 필터링



내용 기반 필터링, 협조 필터링, 실용하기 위해서는 각각 큰 단점을 가지고 있습니다. 따라서 시스템 구축 시에는 각 필터링의 좋은 점을 조합하여 추천 시스템을 구축하는 것이 일반적이며, 이것들을 하이브리드라고 합니다.

좋은 웹페이지 즐겨찾기