学术咨询

让论文发表更省时、省事、省心

推荐系统中时间周期系数的引入

时间:2020年01月09日 分类:电子论文 次数:

摘要:推荐系统在电子商务系统得到了广泛应用,但是其中物品推荐法假设中没有考虑时间周期系数,容易造成无效推荐。本文针对具体问题场景,讨论了在UserProfile和ItemProfile中引入时间参数,并给出了初步的工程解决方案,可以提高日用品和儿童商品推荐的针

  摘要:推荐系统在电子商务系统得到了广泛应用,但是其中物品推荐法假设中没有考虑时间周期系数,容易造成无效推荐。本文针对具体问题场景,讨论了在UserProfile和ItemProfile中引入时间参数,并给出了初步的工程解决方案,可以提高日用品和儿童商品推荐的针对性,有较好的实践性。

  关键词:推荐系统;时间周期;UserProfile;ItmeProfile

计算机应用

  一、引言

  广义上的推荐系统可以理解为是主动向用户推荐物品(Item)的系统,所推荐的物品可以是音乐、书籍、餐厅、活动、股票、数码产品、新闻条目等等,推荐系统所推荐的物品或者对用户有帮助,或者用户可能感兴趣。随着电子商务规模的不断扩大,商品数量和种类不断增长,用户对于检索和推荐出了更高的要求。

  由于不同用户在兴趣爱好、关注领域、个人经历等方面的不同,以满足不同用户的不同推荐需求为目的、不同人可以获得不同推荐为重要特征的个性化推荐系统(PersonalizedRecommenderSystem)应运而生。从目前公布的数据看,Amazon发布的数据显示,亚马逊网络书城的推荐算法为亚马逊每年贡献近三十个百分点的创收。实际上推荐已经有逐渐替代传统搜索的趋势,被主流电商如阿里、京东广泛重视。

  二、推荐系统

  考虑如何发现数据的相关性:推荐系统大致上可以分为如下几种:基于人口统计学的推荐。基于内容的推荐基于协同过滤的推荐推荐系统可能的输入数据多种多样,但是归纳起来可以分为用户(User)、物品(Item)和评价(Review)三个层面,它们分别对应于一个矩阵中的行、列、值。

  物品(Item)用来描述一个Item的性质,也经常被称为ItemProfile。根据item的不同,ItemProfile也是不尽相同的。比如对于图书推荐,ItemProfile有可能包括图书所属类别、作者、页数、出版时间、出版商等;对于新闻推荐,ItemProfile则有可能是新闻的文本内容、关键词、时间等;而对于电影,可以是片名、时长、上映时间、主演、剧情描述等。用户(User)用来描述一个用户的“个性”,也就是UserProfile。根据不同的应用场景以及不同的具体算法,UserProfile可能有不同的表示方式。

  三、内容推荐法

  基于内容推荐法所基于的基本假设是“一个用户可能会喜欢和他曾经喜欢过的物品相似的物品”。这里“曾经喜欢过的物品”就是利用该用户的历史记录计算出来的Profile,作为该用户的UserProfile来使用。

  四、问题的提出

  在实际操作中,如果只是简单采用内容推荐法,而不考虑具体产品的时间因素,可能会造成一定量的无效推荐。下面是几个例子:

  (1)使用寿命较长的产品。用户如果买了电视机等有较长使用寿命的物品,正常情况下,在产品的正常使用寿命内,他或她不会再对此类产品感兴趣。所以如果基于内容推荐法的基本假设,向一位刚购买过电视机并没有退货的用户再推荐类似产品,用户的再次购买的可能性很低,这就是无效推荐。这类产品以家用电器、家居用品为主。

  (2)儿童产品。假设某用户在八个月内一直买某品牌奶粉一段的产品,那么根据内容推荐法的假设,系统应该持续向该业务用户推荐该品牌一段奶粉。然而根据婴儿的生长规律,8个月的婴儿逐步要从一段奶粉向二段奶粉过渡了,这时候比较合适推荐的产品其实是二段奶粉以及婴儿辅食,所以此类推荐也是无效推荐。

  五、时间系数的引入的解决

  基于以问题为导向,我们尝试在基于内容的推荐系统中引入时间参数来解决问题。

  (1)针对产品固有的使用周期问题,在ItemProfile中引入使用寿命参数。初始的时间周期使用周期参数可以参照统计,比如枕头的科学使用周期为2年。同时每个用户的购买清单中记录了此类商品的购买时间点,所以可以在UserProfile中添加该类商品的到期时间,即Date产品到期=Date上一次购买此类商品+Period默认通过定时器技术,推荐系统约在到期时间的2/3时间开始推荐此类商品进入推荐列表,离到期时间越近推荐越频繁。

  一旦用户完成第二次此类商品的购买,系统可以自动更新该用户对此类商品的使用周期Period该用户,即:Period该用户=Date上上次购买此类商品-Date上次购买此类商品Date产品到期=Date上次购买此类商品+Period该用户显然经过反复的数据训练,系统可以更准确的预测用户对该类商品该兴趣的时间周期。需要注意的是一点是,由于双十一,618存在用户囤货的情况,在电商大促期间发生的购买行为不应该用来调整此用户对该类商品的使用周期。

  对于使用寿命较长的商品,比如电视冰箱空调等使用寿命高达十年,用户发生购买的频率较低,同时时间长变数大,推荐系统的作用对此类商品的购买决策作用不大。可以将商品的使用周期设置为无限。对于使用周期比较敏感的产品主要有日用品,比如米面油奶饼干等食品类,筷子垃圾袋保鲜膜等厨房用品,牙膏毛巾纸巾等个人清洁商品等。

  (2)针对儿童不同年龄段的需求不同的问题,对于处于为人父母的用户,UserProfile中加入子女的基本年龄情况估计。用户子女的年龄信息最好从用户的购买行为中采集。需要在ItemProfile中设置产品敏感年龄,比如奶粉、尿布、辅食、玩具、教辅用书、童装等就有明确针对年龄段,而其他产品可以设置为针对所有年龄。一旦用户购买了两次年龄敏感商品,系统就可以初步使用线性拟合估计该用户孩子的年龄,购买的次数越多,数据也就越准确。而一旦出现较大的年龄偏差(大于等于1岁),可以预设该用户有第二个孩子,以此类推。

  六、结论

  通过在内容系统的ItemProfile和UserProfile中引入时间系数,可以提高日用品和儿童商品推荐的针对性,帮助电商更好地完成创收。

  参考文献

  [1]王东雨.音乐推荐系统性能调查探究[J].情报工程,2015,1(6):113-119.

  [2]范家兵,王鹏,周渭博,etal.在推荐系统中利用时间因素的方法[J].计算机应用,2015,35(5):1324-1327.

  计算机系统论文投稿刊物:计算机应用(月刊)创刊于1981年,由中国科学院成都计算机应用研究所主办。该刊把介绍计算机应用技术作为重点,以推动经济发展和科技进步为宗旨。