学术咨询

让论文发表更省时、省事、省心

基于KNN算法的农产品电商精准营销的研究

时间:2019年07月06日 分类:农业论文 次数:

摘要:近年来,随着大数据、云计算、人工智能等技术的逐渐成熟与落地,互联网电商蓬勃发展,企业在电商方向上的营销理念和方法已与传统营销的理念和方法截然不同,其依托于现代技术发生了革命性的变化,基于大数据与人工智能的客户精准营销已成为主流,而基

  摘要:近年来,随着大数据、云计算、人工智能等技术的逐渐成熟与落地,互联网电商蓬勃发展,企业在电商方向上的营销理念和方法已与传统营销的理念和方法截然不同,其依托于现代技术发生了革命性的变化,基于大数据与人工智能的客户精准营销已成为主流,而基于互联网电商的农产品精准营销由于其自身的特性目前还处于研究探索阶段,本文主要研究基于某农产品电商平台提供的农产品销售数据,针对购买者的个人信息如所处地域、职业等,以及行为偏好采用改进的K近邻算法对用户进行分类,从而达到农产品电商精准营销的目的。

  关键词:K近邻算法;机器学习;大数据;农产品电商;精准营销

农村经济与科技

  消费者在电商平台的日常消费中积累了海量数据,包括了消费者的地域、性别、年龄、行为习惯、个人偏好等,这些数据可以帮助我们为消费者进行消费预测行为分析,从而动态的感知到消费者将进行的消费活动,从而推动消费升级。这与传统营销的方法相比,在降低社会成本的同时,极大的提高了效率和准确率,对农产品电商的精准营销具有重大意义。本文基于人工智能机器学习的KNN算法实现了对目标用户进行购买品类、购买意向多维度分类,从而助力于农产品电商的精准营销,促进农产品电商产业的发展。

  一、农产品电商精准营销及其研究现状

  现阶段农产品电商精准营销是通过对消费者在电商平台进行购物留下的数据的全面分析,挖掘出海量数据中所包含的消费者的性别、地域、收入水平、消费习惯、个人偏好等信息,从而准确预测出消费者未来的消费行为,并制定出一对一的动态的营销策略以满足消费者需求。随着互联网技术的发展,目前业界在解决精准营销问题时是通过使用Hadoop、Spark等分布式数据处理框架对电商平台上的海量用户数据进行挖掘、清洗,并使用机器学习算法对经过处理后的有价值的数据进行处理,找出数据中蕴含的知识和规律,得到模型,并将其应用到对未来获取到的数据的分析及预测中。

  二、KNN算法在电商农产品精准营销上的应用

  本文提出一种基于KNN算法的电商农产品精准营销预测解决方法,即对用户行为进行汉明编码,然后计算用户之间的距离,从而对用户未来的农产品消费行为进行预测,实现了将KNN算法应用在农产品电商精准营销这一特定的业务场景下,且较之于传统的数据分析预测方法,具有更高的决策准确率和决策效率,更加智能化。

  (一)数据预处理

  本文通过问卷调查形式获取了1000组用户性别、年龄、个人偏好、是否购买过以及消费意向、消费者之间关系、地域等数据,对用户是否具有购买鱼的意向这一消费行为进行预测。本文结合具体营销场景筛选具有代表性的特征作为研究使用数据集,其中字符’Y’表示肯定,字符’N’表示否定,如此表示是为了降低在数据特征描述时的复杂度。

  (二)数据特征描述

  在KNN算法中,我们可以用汉明距离来度量各个样本数据之间的距离。在本文的数据样本中,我们将字符’Y’表示的特征项编码为1,将字符’N’表示的特征项编码为0。值得注意的是,结合实际的农产品电商精准营销,考虑到由于60岁以上的群体在食用鱼时具有被鱼刺伤到的危险性,故将60岁以上数据样本中性别这一特征编码为0,另外,由于中国传统文化的原因,女性在家庭食材消费上的重要性,我们将数据样本中性别女这一特征项编码为1,相对的性别男这一特征项编码为0。

  因此,我们得到图一中数据样本的编码分别为1111、0110、0111、1101、1010、1011。将用户的各项特征进行编码后,便可以计算编码之间的汉明距离,汉明距离的大小,便能表征各个用户之间的差异性和相似性。

  (三)KNN特征分类算法的应用

  本文在得到用户各项特征编码之后,然后计算各用户特征项编码之间的汉明距离。接下来,我们通过实验的方式,选取出一个合适的汉明距离阈值K来对用户的购买意向进行预测。在阈值K之内的同一组用户,我们认为其具有相同的购买意向。

  算法基本流程如下:Step1:计算用户特征项编码的距离。计算测试集中给定样本编码与训练集中每个样本编码的汉明距离;Step2:汉明距离的排序。将计算出的汉明距离进行降序排序;Step3:选择给定样本的K个近邻:根据排序结果,选择距离最近的K个样本作为待预测的样本的类别,认为他们具有相同的购买意向。K即为上述阈值;Step4:分类的判别。查找出K个近邻的类别,在此情景下,类别即为是否具有购买意向。然后按照投票的方式决定待分类样本的类别。

  三、模型设计与测试结果

  (一)农产品电商精准营销系统框图本文我们实现了一个基于KNN算法的农产品电商精准营销系统,研究了农产品电商中特征项的提取及特征项在向量空间上的距离计算。

  (二)实验测试我们随机抽取80%的数据作为训练样本,剩余20%作为验证样本,对基于KNN算法实现电商农产品的精准营销进行研究。在本文设计的模型中,阈值K的选取对预测精确度起有着明显的影响。理论上来说,阈值K对预测分类的精确度起决定性的影响,当K越小时,分类边界曲线越光滑,分类精度越高;K越大分类边界曲线越平坦,分类精度越低。距离K的选取在本文中变现为阈值K的选取。从实验结果看来,当选择阈值K的值为10的时候,本模型具有较高的预测精度。

  (三)实验结果分析在本文的预测模型中,阈值K的选择对预测结果起着至关重要的作用。从多次实验结果来看,当训练集为800验证集为200的情况下,阈值K=10时具有较高的预测精度。另外,在农产品电商精准营销领域的预测模型中,特征项的选取对预测结果的精度有密切的关系。例如,鱼这种农产品,消费者的自身属性以及购买动机是多维度的,非常复杂的。

  在特征项的提取时要注意的是,特征项并不是越多越好,我们要结合社会实际情况对一些特征项进行取舍。每个特征项的编码也是需要深入研究的地方,要考虑进各个特征项之间的相互影响,此时便需要多位编码来表征一项特征项了。

  四、结束语

  实验结果表明,本文设计的电商农产品精准营销系统模型对消费者的购买意向预测具有较高的精度,可以为企业在其精准营销中做为决策依据。然而,由于数据样本的不足,本文的预测模型在特征项提取上还有较大的研究提升空间。

  本文为电商农产品的精准营销提供了一个可靠的解决方案,同时,也对今后的研究工作重心有所展望:(1)在能够提供足够多的数据样本的前提下,在对特征项的提取上结合农产品电商这一特定领域的实际情况进行进一步的研究。特征项之间的相互影响是存在的,所以本文中将某一特征项编码为一位在表征特征项之间的相互作用时便显得不足。特征项的编码应该是多位的,能充分体现出特征项之间的相互影响的。(2)在计算各特征项编码的汉明距离之前,如果数据量比较大,我们需要对特征项的编码进行压缩,以提升算法的性能。这是在大数据的场景下需要研究的重点问题。

  电商方向评职知识:哪些期刊征稿发表农村电商脱贫论文

  随着农村经济的快速发展,农业从业人员也成为了评职的重点人群,而最近就有很多农业人员咨询哪些期刊能发表农村电商脱贫的论文,小编解答:经济类,政治政策类,农业发展类文章都是能接收这方面论文的,您可以具体咨询我们的编辑老师,他们会评估您文章内容是偏向哪个方向,研判适合投稿的期刊,这样也不会耽误您评职。