冷启动( cold start )在推荐系统中表示该系统积累数据量过少,无法给新用户作个性化推荐的问题,这是产品推荐的一大难题。每个有推荐功能的产品都会遇到冷启动的问题。一方面,当新商品时上架 会遇到冷启动的问题,没有收集到任何一个用户对其浏览、点击或者购买的行为,也无从判断如何将商品进行推荐;另一方面,新用户到来的时候,如果没有他在应用上的行为数据,也无法预测其兴趣,如果给用户的推荐千篇律,没有亮点,会使用户在一开始就对产品失去兴趣,从而放弃使用。所以在冷启动的时候要同时考虑用户的冷启动和物品的冷启动。
用户冷启动
用户冷启动主要解决如何给新用户作个性化推荐的问题。
- 利用用户账号信息,比如邮箱。去关联整个集团的公共特征库。
- 利用手机IMEI UDID IDFA号唯一标识码关联。有些公司对匿名用户的数据也会有日志收集。根据匿名的用户行为,进行关联推荐。也可以通过第三方广告公司去购买用户特征数据。
- 制造选工页,让用户选择自己感兴趣标签。比如说斗鱼直播,在首次登陆之后,用户会收到一个选择页面,你可以选择
英雄联盟
,二次元
,绝地求生
等标签,然后冷启动会立即选择这几个品类的热门数据进行补充。
物品冷启动
物品冷启动主要解决如何将新的物品推荐给可能对它感兴趣的用户这一问题。
- 利用物品的内容、分类信息。通过标签关联。
- 利用专家标注的数据,将物品的特征加入到实时特征库。
- 运营直接干预,对新出现的物品,进行人工干预强推。
系统冷启动
推荐系统冷启动,可以通过人工标注的比较好的热门数据,作为兜底推荐。在推荐数据为空的情况下,通过兜底推荐也能保证用户和物品被推荐出去。
冷启动策略
基于标签的相似视频推荐基本不存在冷启动问题,因为任何新注入的视频都是包含标签的,并且我们是近实时为新节目计算相似视频,在极短的时间内就会为新节目计算出相似推荐。本节我们来说说实时个性化推荐冷启动问题。
因为是基于内容的推荐,冷启动问题没有那么严重,只要用户看过一个视频,这个视频的标签就是用户的兴趣标签,我们可以为用户推荐具备该标签的节目。但是,如果用户一个节目都没看,那要怎么为用户做推荐呢?
我们可以采用如下3大策略:
- 利用新热节目作为推荐;
- 基于用户特征(比如用户地域)来为用户生成相关推荐列表;
- 从所有视频中选择不同类别的视频推荐给用户,总有一款是用户喜欢的。