推荐系统的数据来源,按照显性程度可分为三种:,今天小编就来说说关于推荐系统的基础知识?下面更多详细答案一起来看看吧!
推荐系统的基础知识
推荐系统的数据来源,按照显性程度可分为三种:
1、用户对物品/服务的直接打分,比如买家对淘宝商品的好评、中评、差评,豆瓣用户对电影、书籍的评分。
——打分数据直接反映用户喜好,可以直接用。只是,并非所有用户都会提供评分,而强行要求用户给出评价又会严重影响用户体验。所以直接打分数据通常是稀疏的,对推荐系统来说,不够用。
2、用户在平台上的各种行为,间接反映对物品/服务的偏好程度。比如:页面停留时长、子页面访问深度,页面交互行为等。
——这些数据有约定俗成的认知:在页面上停留越久,翻到越后面的子页面,在页面上来回滚动,一般代表用户越喜欢,所以做一个这样的认知转化就可以用了。虽然这样的认知转化有时会被挑战,比如用户在页面上停留或来回滚动可能是因为页面设计不清晰或者交互有bug,但这个需要另外验证,在确认其他可能性前,没必要太纠结。行为数据,相对打分而言,密集得多,更适合推荐系统。
3、物品/服务本身的特征,比如二次元漫画、战争片、丝巾等,通常跟用户特征之间存在一定映射关系。
——这种数据,推理的成分显然更大,但它是前面两种数据的重要补充,尤其是冷启动阶段,行为数据不够多的时候,另外也有利于分析背后的偏好原因,可以作为推荐系统的理由之一。
,