Open dbthinking opened 2 years ago
为什么推荐系统不那么好用了,推荐系统应该是什么样,最近有些碎片化的想法,简单串起来记录一下。
所谓个性化推荐系统,是需要捕捉用户的预期与偏好,帮助用户发酵新老信息,持续满足这些需求。
个性化推荐目前出现偏差的主因,我觉得是过度依赖协同过滤,在用户协同时,很难先清晰地理解用户的特征偏好,也很难给小众的用户兴趣分群,导致太容易出一些“大众化”的“烂内容”给其他用户。
理想状态下的个性化推荐系统,也就是理想状态下用户想要自动获取什么内容,一方面是通过内容的特征(内容主题、内容深度、价值偏好、内容源更新)来做推荐,另一方面也需要通过用户与内容的协同来发掘更好的潜在的内容,可能还需要通过用户分享来做推荐,最后一方面是试探与探索。整体比例我觉得是621。
最小颗粒度的兴趣点,可能是source + topic 的组合,然后利用source与topic之间的协同,去发掘更多兴趣点。另一个问题是用户的兴趣点可能是孤立的,很难通过不断的协同发掘出来。
当然更重要的前置问题是如何判断用户真的喜欢某个内容或某个主题,需要要多鼓励用户的主动表达与被动表达,系统也要能捕捉理解。比如说搜索框能让用户更主动开放地表达兴趣;比如说候推荐列表与相关推荐,实际上决定了用户表达的可能性;比如说用户对内容的消费状况也非常重要,而不能只是局限于点击或几秒阅读。
总体来说,首先是内容能不能触达用户,以什么样的方式与频率;其次是如何判断用户喜欢这个与这类内容,必须有系统化的内容试探体系与合理的正负样本判断模型;最后如何协调试探与推荐的动态比例,以及统筹不同兴趣点何时何地何序呈现给用户。
为什么推荐系统不那么好用了,推荐系统应该是什么样,最近有些碎片化的想法,简单串起来记录一下。
所谓个性化推荐系统,是需要捕捉用户的预期与偏好,帮助用户发酵新老信息,持续满足这些需求。
个性化推荐目前出现偏差的主因,我觉得是过度依赖协同过滤,在用户协同时,很难先清晰地理解用户的特征偏好,也很难给小众的用户兴趣分群,导致太容易出一些“大众化”的“烂内容”给其他用户。
理想状态下的个性化推荐系统,也就是理想状态下用户想要自动获取什么内容,一方面是通过内容的特征(内容主题、内容深度、价值偏好、内容源更新)来做推荐,另一方面也需要通过用户与内容的协同来发掘更好的潜在的内容,可能还需要通过用户分享来做推荐,最后一方面是试探与探索。整体比例我觉得是621。
最小颗粒度的兴趣点,可能是source + topic 的组合,然后利用source与topic之间的协同,去发掘更多兴趣点。另一个问题是用户的兴趣点可能是孤立的,很难通过不断的协同发掘出来。
当然更重要的前置问题是如何判断用户真的喜欢某个内容或某个主题,需要要多鼓励用户的主动表达与被动表达,系统也要能捕捉理解。比如说搜索框能让用户更主动开放地表达兴趣;比如说候推荐列表与相关推荐,实际上决定了用户表达的可能性;比如说用户对内容的消费状况也非常重要,而不能只是局限于点击或几秒阅读。
总体来说,首先是内容能不能触达用户,以什么样的方式与频率;其次是如何判断用户喜欢这个与这类内容,必须有系统化的内容试探体系与合理的正负样本判断模型;最后如何协调试探与推荐的动态比例,以及统筹不同兴趣点何时何地何序呈现给用户。