margaretmm / myblog

my tech blog
0 stars 1 forks source link

流媒体播放推送平台的大数据场景 #14

Open margaretmm opened 6 years ago

margaretmm commented 6 years ago
  媒体播放平台公司的价值来源什么?  给用户提供 良好的观影体验!  有哪些因素会影响用户体验?  优质的节目内容, 流畅的播放质量等, 这些和传统的电视台类似,  但 还有一些特殊的用户体验提升因素......
  因为媒体播放平台 的内容推送对象 是 和账号或者终端(客户端应用/浏览器 )是绑定的, 所以媒体播放平台除了有大量的媒资数据, 还有用户方数据(账号, 终端IP等) , 此外有的流媒体公司,还会利用 在客户端软件中埋点 用户行为 的日志数据, 收集用户点击行为信息, 这样丰富了用户端的 特征维度.
  既然流媒体公司有了这么多维度的数据, 怎么利用好这些数据,  大数据怎么玩起来, 来优化用户体验?  

default

 如上图所示,一般流媒体播放平台的数据主要有如上几大类,  常见的大数据场景有:
  1. 用户画像和 媒资画像数据 结合 可以做 个性化推荐; 用户的观影喜好信息, 和媒资的属性信息 做关联, 做到"千人千面"; 给相似观影爱好的用户, 推荐相似性高的用户最近观看的影片; 根据统计用户的观影喜好(主角, 导演, 影视风格等 ), 分析定制 视频类节目;

    1. 设备画像 和 媒资画像数据结合 可以做 提升流体验提升 边缘域如 哪些区域的CDN上缓存哪些媒资, 能保证播放传输的流畅性; 设备性能好的客户端 , 推送清晰度较高一些的 媒资;

    2. 用户画像 + 设备画像+ 媒资画像 针对会员用户, 提供更好的观影 内容和性能体验 ;

    3. 舆情&质量反馈+ 用户画像 结合会员反馈意见和与用户浏览行为相关的内在因素,建立模型来预测某一特定的内容是否存在质量问题

    4. 舆情&质量反馈+ 媒资画像 如果在一个节目的某个时间节点观看量(点击量, 平均观看时长等)大幅下降, 可以结合用户提供的相关反馈信息,分析这段节目可能存在的质量问题(建立起质量控制的良性循环机制), 比如运用自然语言处理和文本挖掘技术可以构建强大的机器学习模型, 用于提升线上内容的质量,更换不符合会员期望的内容

    6, 视频内容(上图中没有列) 根据视频识别, 自动化截屏高质量的视频图片, 用于建立各个媒资的优质素材库, 优化界面体验, 提升用户粘性; 通过视频识别, 识别出视频中的主角, 自动化打标签(如果是新媒资 , 还没有主角等相关属性的场景下);