学术咨询

让论文发表更省时、省事、省心

基于方面词的用户消费心理画像方法

时间:2021年12月31日 分类:推荐论文 次数:

摘要:[目的]针对用户消费心理画像方法较少的问题,以三层次体验理论为依据,从用户评论中挖掘用户的消费心理和消费偏好。[方法]首先建立体验层次-产品特征-方面词之间的映射关系,然后利用方面词提取技术,从用户评论中挖掘用户对不同体验层次的关注度,将用户分为本

  摘要:[目的]针对用户消费心理画像方法较少的问题,以三层次体验理论为依据,从用户评论中挖掘用户的消费心理和消费偏好。[方法]首先建立体验层次-产品特征-方面词之间的映射关系,然后利用方面词提取技术,从用户评论中挖掘用户对不同体验层次的关注度,将用户分为本能偏好、行为偏好、反思偏好三种类型,最后使用基于深度学习的方面词情感分析技术计算得到用户对于产品的喜爱度,进一步分析不同类型用户的特点。[结果]基于90余万条京东手机评论数据进行应用分析,获得了三类消费偏好用户群,其中本能偏好用户占比41.6%,高于行为偏好用户(占比33.01%)和反思偏好用户(占比25.39%),并从手机品牌以及价位等方面分析了三类用户的消费特点。[局限]目前实验仅以京东手机评论数据集为例,未来可使用多种产品、多个平台的评论数据集,以获得更丰富完善的用户画像与消费偏好。[结论]本文的用户画像方法可以较好地表达不同类型的用户的消费偏好。

  关键词:三层次体验理论;消费心理;用户画像;产品特征;方面词;情感分析

消费经济

  引言

  随着市场竞争的日益激烈,企业越来越重视对于用户消费心理和消费偏好的研究,以向用户提供更好的产品与服务。用户画像是对真实目标用户的一种虚拟的表示,是互联网时代产品设计过程中重要的考虑因素。近年来,研究者对用户画像方法进行了大量研究。这其中,基于用户人格特性或心理的画像能反映内在用户人格与外显的兴趣、行为之间的关联,常被认为是反映了用户更本质特性的画像。

  常见的基于人格的用户画像通常使用经典的人格模型、如大五人格模型[1]来描述用户的个性特质,例如Carducci等人使用推特文字数据训练神经网络获得用户的大五人格画像[2],Deeva使用社交网站上的用户个人信息以及与其他用户的交流情况计算得到用户的大五人格画像[3]。然而,这类研究多是基于社交媒体数据,并不能直接用于分析消费行为。对于企业来说,仍需要一种能够较直接的了解用户消费心理的理论和方法。Norman提出了三层次体验理论[4],将用户的消费体验和产品的设计要求分为三个层次:本能层(instinctlayer)、行为层(behaviorlayer)、反思层(reflectionlayer)。

  本能层是外观要素和第一印象形成的基础,强调产品给人的初步印象,着重于产品的外观、触感、声音等;行为层与产品的使用体验相关,如功能、性能、可用性等,即这个产品能做什么、如何完成其功能、用户能否理解产品的功能并达到预期效用;反思层涉及了高级的感知觉和情感,对于产品的诠释、理解、推理都来自反思层次。它与用户的自我认同、对品牌的认同、用户与商家的互动、记忆等因素有关,体现了产品与用户的自我认同之间的交互作用,例如用户拥有或使用某产品时的骄傲感。通常情况下,用户购买与使用产品的体验涉及了所有的三个层次,它们对应了用户对产品的不同特征的心理需求和消费体验。Norman的三层次体验理论提供了一个从消费心理角度分析消费者的视角。

  然而,这个理论当前主要被应用于指导产品设计,目前仍缺少一个有效的方法、能够将其应用于了解用户消费心理。在此背景下,本文以Norman的三层次体验理论为依据,提出了一种基于用户评论的用户消费心理分析方法,通过用户评论反映用户消费时的关注点,进而折射出消费心理。论文首先分析消费心理词汇之间的关系,然后挖掘隐含在用户评论中的用户体验和情感态度,从而刻画用户消费心理偏好。

  为了进行细粒度的分析,论文提取了方面词这一评论语句中词语级别的关注对象,对其进行分析。Nelson的产品分类理念根据消费者对产品特征的认知,将产品划分为搜索型产品、体验型产品、信任型产品[5]。手机作为一种典型的搜索型产品,会在购物平台上呈现多项参数信息,且其功能多样,用户可提出评价的方面具体而丰富,便于根据用户评论分析消费心理词汇之间的关系并进行用户画像。因此,论文以手机产品为例,基于90余万条京东手机评论数据集,采用基于方面词提取技术的分析方法和基于方面词的情感分析技术进行了实验分析,获得了用户对于手机的消费心理画像。

  2相关工作

  2.1用户画像

  在刘海鸥等[6]定义的四类用户画像方法中,基于用户行为的画像方法通过分析用户网络浏览日志,得到不同群体的用户行为特征,并将其作为画像结果[7]。

  基于兴趣偏好和主题的两种方法关注与用户相关的文本,前者利用平台上的信息探究用户的显性和隐性兴趣点,挖掘个性化的偏好和需求,例如Zheng等人综合计算用户及其跟随者的信息获得群体用户画像[8];后者关注用户与主题之间的关联,例如Zarrinkalam等人基于用户特征的演变,预测用户未来可能关注的话题[9]。基于用户人格和情绪的分析方法会同时关注用户行为特征、兴趣偏好等内容,并将其与用户的人格综合进行分析,得到内在的人格与外显的兴趣、行为之间的关联。

  对用户心理学特征的分析不仅有利于探索用户的兴趣方向,而且有利于进一步探究这种方向产生的心理学因素,得到更加本质的用户画像。由于社交媒体中的文本信息较为丰富,能够折射出用户心理和人格,因此研究者们常通过社交媒体上的用户数据分析用户的人格特质。然而,这类研究较少涉及购买行为,所以简单的基于人格的用户画像方法并不直接适用于消费场景。如果想要在消费场景下探究用户个性与商品特征的关系,就需要引入其他表达心理学特征的方式,例如Liu等人引入表示消费偏好的抽象层,建立了用户人格特质消费偏好产品属性之间的联系和似然轨迹图(LikelihoodTraceGraph)10。

  2.2人格与词汇使用

  许多研究表明,人的个性特质与其在文本写作过程中使用的词汇有关,不同人格的差异不仅会体现在他们的想法、感受、行为上,也会体现在这些人对自己的想法、感受或行为的描述上[1。这一规律对不同的人格模型和不同的文本类型均有效,许多人格的计算模型也是依此建立的。

  例如,Lin等人发现大五人格除尽责性外,都与LIWC(LinguisticInquiryandWordCount)词典划分的部分词语类别的使用频率有关[12];大五人格模型中高开放性的人倾向于使用更多的冠词和介词,高神经质的人倾向于使用更多的负面情绪词,如糟糕、懒惰、压力等[11];MBTI模型和大五模型中外倾性的人的动词使用率都更高;MBTI模型中的判断型与大五模型中的尽责性都与认知词和期望词的高使用率以及脏话的低使用率有关[13]。

  人格与词汇使用的研究可基于多种类型的文本进行,例如Lin等人[12]和Yarkoni[11]均采用用户在社交网络上的发言作为研究对象,Lee等人[13]则要求被试现场进行意识流写作。此外,结构化访谈[14]和日常对话文本[15]也可以用于人格与词汇使用规律的分析。当我们将用户对三层次的关注度视为一种相对稳定的个性特质,就可以据此推断,用户对三层次的关注度与词汇使用规律有关,可以根据用户的评论文本内容来推断用户偏好的层次。

  2.3方面词提取

  方面词(aspect)是指在一条评论语句中词语级别的关注对象,表达了用户的某个关注点。方面通常被分为显式方面与隐式方面[16]。显式方面指的是在评论中直接指明的名词性方面词,如“屏幕很大”中的“屏幕”;隐式方面通常不会直接指明,如“物有所值”代表了隐式方面“价格”。

  当需要围绕特定产品特征抽取方面词时,研究者通常会选用以LDA(LatentDirichletAllocation)[17]为基础的主题模型。例如Blei等人[18]在样本中加入用户反馈信息,构造了一种用于提取名词短语的有监督学习方法;Das等人[19]采用LDA以及wordvec的方法,从用户评论中提取手机产品的方面词;Ekinci等人[20]提出了NETLDA模型,可以结合语意信息,使模型抽取的方面词具有语意相关性。

  然而,目前的主流算法大多高度依赖人工标注、语料库、规则模版或其他形式的人工干预,算法模型在不同领域间的可移植性低。而LDA算法在不使用种子词集时,难以准确将方面词与产品特征相对应,但使用种子词集时也同样存在着过度依赖种子词集,可移植性差的问题[16],在本文数据集上的表现并不好。同时,也有部分研究者采用其他方法和规则来提取方面词:如Xia等人[21]使用主题图定义了方面间的层级关系、方面与对应情感词间的关系等,并在情感词独立出现时利用主题图中的规则提取隐式方面。因此,本文也将自定义一种提取方面词的规则。

  2.4情感分析

  在方面词提取的基础上,要建立好用户画像,还必须进行基于方面词的情感分析。考虑到用户可能在一句话中对产品的不同方面表达不同的情感态度,该任务在情感分析领域中被公认为粒度较细、难度较大[2。目前的主流方法是通过深度学习来赋予模型细粒度的情感判断能力。Tang等人[2提出了基于目标的长短时记忆网络模型(argetpendentongShorttermemoryodel,TDLSTM),分别通过两个独立的长短时记忆网络来提取方面词左右两边语境的特征,获得了显著优于规则类算法的实验结果。

  基于变换器的双向编码器表示技术[2(directionalncoderepresentationsfromransformers,BERT)等预训练语言模型的问世则进一步提升了神经网络在方面词情感分析任务中的表现。Karimi等人[2在实验中使用基础BERT模型来处理方面词情感分析任务,发现其效果已经超过绝大多数普通神经网络模型。肖宇晗等人[2则在BERT的基础上进行注意力机制方面的探索,提出结合BERT的双特征嵌套注意力模型(ualeaturesttentionoverattentionwithBERT,DFAOABERT),获得了非常优秀的实验结果,因而本文采用该方法进行情感分析。

  3研究方法与实验数据

  3.1方法概述

  本文以三层次体验理论为指导,结合方面词提取和情感分析技术,提出了一种基于方面词的用户消费心理画像方法。

  (1)消费心理方面词的关系分析。首先要建立消费心理和评论用词之间的关系。根据三层次体验理论,与产品专家讨论,将多项产品特征分别划入本能层、行为层和反思层,然后从评论中抽取方面词,并结合语义将常见的方面词与产品特征描述相关联,建立体验层次产品特征方面词的映射表。

  (2)关注度分析。在上述映射词表的基础上,基于用户评论中方面词被提及的频度分别得到产品特征的关注度和体验层次的关注度,并根据用户对体验层次的关注度,将用户分为本能偏好、行为偏好、反思偏好三类。

  (3)喜爱度分析。对评论进行细粒度的方面词级别的情感分析,获得用户对该方面词的情感倾向,并在不同体验层次上对方面词的情感态度进行综合得到用户喜爱度,用情感分析的结果刻画不同用户群体的消费心理画像。

  3.2消费心理

  方面词关系分析本文首先根据三层次体验理论,将产品特征依次划入本能层、行为层和反思层。刘典[26]在对某款音箱的研究中,将用户了解产品的过程分为个阶段:第一阶段是通过网络等媒介获取产品造型和数据信息,对产品的感知都来自视觉信息的加工;第二阶段则是对实物产品进行近距离的观察,初步了解产品性能;第三阶段中,用户亲自操作产品,了解产品真实的操作感和使用性。用户对本能层次的感知主要来源于第一阶段,例如参数、外观等;行为层则主要来源于第三阶段,因此它包含产品性能、具体操作体验相关的特征;反思层的体验则在以上三个阶段都会产生,例如产品的身份感、艺术感、独特性,是否符合用户的需求等[26]。

  鲍玉雪等人[27]则指出,某款壁挂式CD机的外观属于本能层,开关功能属于行为层;而怀旧的拉线设计会引起人们的回忆,所以属于反思层。本文以手机为例,结合前人研究与产品专家建议,对各层次包含的产品特征分析如下:本能层代表了产品给人的初步印象,指的是用户使用手机前或使用时可立即获取的信息及感受,例如外观、价格、在网购平台上直接可见的参数等;行为层指的是手机大部分复杂功能的使用体验,例如性能、拍照、电池等;反思层指的是用户对自我形象和产品形象的认知,例如品牌、服务、使用该手机的群体,以及国产、科技等抽象概念。

  4实验结果与分析

  4.1数据收集与映射表构建

  论文基于京东手机评论数据进行实验分析。采用数据爬虫,从京东网站上爬取在售手机的相关参数以及用户评论,对3000余款手机进行筛选,排除商品名或店铺名等基本信息不清晰的产品、预订以及二手产品,并且要求每款产品至少包含条好评、条中评和条差评,最终获得了总计1171件手机类产品的904232条评论,其中好评677266条,中评73443条,差评153523条。

  由于网站限制每款手机至多显示1000条好评、1000条中评、1000条差评,获取到的每款手机的评论数在323000条之间。采用结巴分词工具对评论文本进行分词,从词频大于万分之五的词语中选出与产品特征相关的方面词,对分词结果不准确的词语进行修正或补全,(例如将“全面”修正为“全面屏”),并根据常识添加一些与已有属性词相关的词(例如在“价格”中添加“双十一”),再分别识别显式和隐式方面词。

  5结束语

  本文根据三层次体验理论分析用户消费心理,提出了一种新的用户画像分析与计算方法。首先,我们构建了体验层次和评论语句中的方面词的映射关系,将产品评论中的方面词对应到产品特征,再将十五个产品特征对应到三层次,从而建立了体验层次产品特征方面词映射表。基于该词表,我们可以利用方面词提取技术和基于深度学习的方面词情感分析技术,获得各类型用户对产品不同方面和体验层次的关注度和喜爱度,将用户划分为本能偏好、行为偏好、反思偏好三种类型,并进一步得到不同偏好的用户的消费特点。

  从商家的角度来说,当了解了自己产品的用户群分布特征和原因,以及各类用户对产品各方面的喜爱度,就可以结合商家的发展目标,据此判断产品的改进方向。虽然论文仅以手机为例进行了应用分析,然而,只要结合产品信息与评论内容,将产品的特征合理划入三层次,论文方法也同样适用于其他产品用户的消费心理分析。

  手机属于Nelson产品分类中的搜索型商品,未来也可以选择其他商品,如体验型产品进行用户画像,进一步验证本文方法的普适性和有效性。除此之外,体验层次产品特征方面词映射表的构建仍存在改进的空间。目前我们仅以手机评论数据集为例,未来可跨多产品、多平台评论数据集建立词表,以进行更全面的用户消费特点分析;而目前的词表基于人工规则生成,未来可以此为基础开发自动生成词表的机器学习方法,提升基于三层次体验理论的用户画像在不同领域的泛用性和易用性。

  参考文献:

  [1]GoldbergLR.Anlternative"escriptionofersonality":theigfiveactortructure[J].Journalofersonality&ocialsychology,1990,59(6):12161229

  [2]CarducciG,RizzoG,MontiD,etal.TwitPersonality:ComputingPersonalityTraitsfromTweetsUsingWordEmbeddingsandSupervisedLearning[J]Information20189(5):127.

  [3]Deeva,Irin.ComputationalPersonalityPredictionBasedonDigitalFootprintofASocialMediaUser[J].rocediaComputerScience,2019,156:185193

  [4]唐纳德•A•诺曼.设计心理学3,情感设计[M].何笑梅欧秋杏译.第版.北京:中信出版社,2012.(DonaldA.Norman.motionalesign[M].TranslatedbyHeXiaomei,OuQiuxing,The1stedition.Beijing:ChinaCITICpress,2012)

  [5]Nelson.AdvertisingasInformation[J].JournalofPoliticalEconomy,1974,82(4):729754.

  [6]刘海鸥孙晶晶苏妍嫄等国内外用户画像研究综述[J].情报理论与实践2018,41(11):155160.(LiuHaiou,SunJingjing,SuYanyuan,etal.LiteratureReviewofPersonaatHomeandAbroad[J].Informationtudies:Theory&Application2018,41(11):155160.)

  作者:肖寒琼,张馨遇,肖宇晗,林慧苹