Open dbthinking opened 2 years ago
目前很多讨论推荐系统的,主要都是关注存量推荐,比如电影、商品甚至视频等,但我认为增量推荐,才是未来的智能化产品与商业需要优先关注的地方。
第一,在技术难度方面,增量推荐更需要对内容与用户的理解,让用户与特定内容源、话题或观点产生联系。在存量推荐方面,一方面也是上述逻辑;另一方面则是利用用户协同过滤来解决,整体上需要依赖先有一批用户的使用体验后,再尝试推荐给其他人。协同过滤的风险也有不少,首先是已有消费样本数量越大效果才能越好,而积累已消费样本需要机会与时间;其次是初始小样本的误差很大,在逐渐放量的过程中大概率会失效,特定内容的效果会越来越差,而最终能在全体用户群中产生最佳效果的,必然是人类共性的一些东西,而这些东西往往也是比较原始与低级的内容,因为这是所有用户的普遍偏好也是大量用户的主要偏好;最后可能会期待于将大群体划分为小群体,但用户再被分群的时候,又会遇到分群不准确兴趣不聚焦的问题,个体用户是非常多样化多元化的,分群可能还需要与特定话题结合起来,而不是一个群体能代表某个用户的所有兴趣偏好,但这样还不如从兴趣话题出发再走回这里。很多所谓的协同与预测模型,其实是放弃了去理解用户与物品的特性,而寄希望于通过人与人的联系,来解决这个问题,这些模型有一些优点,但肯定不能当做推荐系统的主菜来吃。有些舍本逐末的感觉了。
第二,从内容本身考虑,存量内容可能存在滞后或失效的问题,增量内容由于人为接入,更可能会解决这些问题。存量信息本身可能也是通过增量内容的更新而出现在用户眼前(被推荐或有更新)。如果将增量内容变成了存量内容再推荐也会更低效无趣。存量推荐对于时效性要求低,推荐延迟对用户的体验与感知影响小。增量内容对时效性的要求会非常高,需要更高的响应与推荐优先级。从用户本身去看,他们对增量内容的处理优先级也远高于存量内容(对存量内容的认知相对更多更健全,很难被影响)。
第三,从内容生态考虑,分发增量内容比分发存量内容对生态的效果更好,增量内容对内容发布者的激励效果更好,也会激励作者发布更多优质新内容。内容量的增加也更容易增加对内容发布者的理解,以及用户对内容的偏好从而判断对内容发布者的偏好。
除了以上问题外,推荐的本质还是满足用户的已有中长期兴趣(用户长期预期),探索性内容的比例不应该超过三成,或者说优先级低于用户关注的东西;另外用户被探索内容吸引而产生的短期兴趣如何处理。在已有中长期兴趣中,对新内容的关注应该超过八成,因为存量知识与内容,意味着存在更系统更高效的学习方式,而不再适合碎片化的推荐(推荐内容更适合作为长内容的引子)。
目前很多讨论推荐系统的,主要都是关注存量推荐,比如电影、商品甚至视频等,但我认为增量推荐,才是未来的智能化产品与商业需要优先关注的地方。
第一,在技术难度方面,增量推荐更需要对内容与用户的理解,让用户与特定内容源、话题或观点产生联系。在存量推荐方面,一方面也是上述逻辑;另一方面则是利用用户协同过滤来解决,整体上需要依赖先有一批用户的使用体验后,再尝试推荐给其他人。协同过滤的风险也有不少,首先是已有消费样本数量越大效果才能越好,而积累已消费样本需要机会与时间;其次是初始小样本的误差很大,在逐渐放量的过程中大概率会失效,特定内容的效果会越来越差,而最终能在全体用户群中产生最佳效果的,必然是人类共性的一些东西,而这些东西往往也是比较原始与低级的内容,因为这是所有用户的普遍偏好也是大量用户的主要偏好;最后可能会期待于将大群体划分为小群体,但用户再被分群的时候,又会遇到分群不准确兴趣不聚焦的问题,个体用户是非常多样化多元化的,分群可能还需要与特定话题结合起来,而不是一个群体能代表某个用户的所有兴趣偏好,但这样还不如从兴趣话题出发再走回这里。很多所谓的协同与预测模型,其实是放弃了去理解用户与物品的特性,而寄希望于通过人与人的联系,来解决这个问题,这些模型有一些优点,但肯定不能当做推荐系统的主菜来吃。有些舍本逐末的感觉了。
第二,从内容本身考虑,存量内容可能存在滞后或失效的问题,增量内容由于人为接入,更可能会解决这些问题。存量信息本身可能也是通过增量内容的更新而出现在用户眼前(被推荐或有更新)。如果将增量内容变成了存量内容再推荐也会更低效无趣。存量推荐对于时效性要求低,推荐延迟对用户的体验与感知影响小。增量内容对时效性的要求会非常高,需要更高的响应与推荐优先级。从用户本身去看,他们对增量内容的处理优先级也远高于存量内容(对存量内容的认知相对更多更健全,很难被影响)。
第三,从内容生态考虑,分发增量内容比分发存量内容对生态的效果更好,增量内容对内容发布者的激励效果更好,也会激励作者发布更多优质新内容。内容量的增加也更容易增加对内容发布者的理解,以及用户对内容的偏好从而判断对内容发布者的偏好。
除了以上问题外,推荐的本质还是满足用户的已有中长期兴趣(用户长期预期),探索性内容的比例不应该超过三成,或者说优先级低于用户关注的东西;另外用户被探索内容吸引而产生的短期兴趣如何处理。在已有中长期兴趣中,对新内容的关注应该超过八成,因为存量知识与内容,意味着存在更系统更高效的学习方式,而不再适合碎片化的推荐(推荐内容更适合作为长内容的引子)。