时间:2019年12月12日 分类:经济论文 次数:
[摘要]本文基于WOS和CSSCI数据库中有关经管学科的引文文献数据,运用CiteSpace文献计量软件对文献共被引、作者共被引和关键词共现等情况进行文献计量可视化的对比分析,明晰了大数据在国内外经管学科的研究趋势与热点。研究结果表明,国外在经管学科大数据的研究,无论是研究的累积,还是研究的深度,均领先于国内,但国内的研究发展势头要快于国外,研究内容也逐渐从定性的理论阐述转向定量的实际应用。
[关键词]经管学科;大数据;文献计量;CiteSpace
一、引言
随着信息技术的发展,信息呈现出爆炸式增长,大数据应运而生,尤其是我国“互联网+”战略的提出,众多行业在近些年出现了突飞猛进的发展,同时也带来了新的挑战[1]153-160。自2008年Nature杂志发表了一期有关“BigData”专刊以来,全球学术界掀起了大数据的浪潮[2]148-155。2011年5月麦肯锡全球研究所(McKinseyGlobalResearchInstitute,MGI)的研究报告中从专业的角度介绍了大数据[3]439-449。2012年瑞士达沃斯论坛更是以大数据为主题之一,认为大数据已经成为一种新的经济资产[4]20-22。
大数据吸引了各个领域的研究人员,采用手工和自动化的方式从各个领域的大量丰富的非结构化数据源中萃取结构化知识,解决具体现实问题[5]62-70,这在商业领域的应用已经非常广泛[6]50-58。但是,大数据在经管学科的分析研究亟待加强[7]177-183。现有大数据在经济学科的应用主要有两方面:研究如何利用机器学习算法改善宏观经济分析技术,提高分析的准确度[8]57-65;采用大数据的方法衡量新经济部门的经济指数,并与传统的经济指数进行对比分析[9]304-316。而大数据在管理学科的应用主要是将大数据应用于资源管理与决策领域[10]158-163、优化人力资源管理部门的开发和管理[6]50-58等方面。
在科学探索中,无论是初出茅庐的年轻学者,还是训练有素的专家,最关注的莫过于从研究领域的海量文献中,找到研究领域中的热点主题和研究趋势,为今后科研工作的开展打下扎实的基础。基于文献计量学的知识图谱能够快速找到时下最为重要和有效的信息,展现研究主题的过去和现在的发展轨迹,是识别前沿与趋势的重要工具,如:赵蓉英和魏明坤[11]3-10,16以大数据结构理论分析为基础,运用CiteSpace软件绘制并分析了国内外大数据的发展现状及研究热点;陈军等[12]173-181基于现下大数据时代日益严重的信息过载这一现状运用文献计量分析和社会网络方法对国内外大数据推荐算法领域的总体情况进行了研究分析。
虽然经管学科研究成果颇丰,但是对于国内外大数据在经管学科的对比分析却相对较少。因此,本文基于中国社会科学引文索引(以下简称CSSCI)和WebofScience(以下简称WOS)数据库,对国内外大数据在经管学科中的研究热点和趋势进行知识图谱的可视化分析。该方法能更清晰、客观和科学地展现出大数据研究在经管学科的知识图谱,为从事经管学科大数据研究的学者和业界提供借鉴和参考。
二、数据与方法
(一)数据来源
本文所需文献数据来源于CSSCI和WOS数据库。具体地,(1)中文文献数据选CSSCI为数据源,分别在学科类型为“管理学”和“经济学”中,进行篇名(词)为“大数据”的论文检索,分别获得了155条和133条施引文献记录。由于有的文献记录既可划分为经济学科,又可归属为管理学学科,因此,除重后的文献数量由原来的288条施引文献数据变为280条施引文献数据,总被引文献共有3087条;(2)外文文献数据来源于WOS数据库,以“bigdata”为主题,在研究方向为“BusinessEconomics”和“OperationsResearchManagementScience”中,检索文献类型为“Article”或“BookReview”或“Review”或“Letter”的文献,共得到370条施引文献数据,总的共被引文献数据为15400条。以上数据下载时间均为2018年3月17日。
可以看出,2013年之后的发文量出现了显著的持续增长,且国外管理学科大数据的研究要远远高于经济学科的大数据研究。最后,可以看出无论是国内,还是国外在经管学科大数据的研究初期,发文量均较低,或几乎为零,但随着大数据开始变得越来越重要,经管学科大数据研究也开始出现爆发式增长。
(二)论文的研究方法
知识图谱法是将引文数据进行信息可视化分析,通过各种多维结构规律图谱,清晰地展示出研究主题的发展历程、演变机理以及内在的逻辑关系,从中获取所研究主题的发展结构、研究热点和前沿问题,以及未来的发展方向。
目前进行知识图谱分析的常用软件主要有:Bibexcel、CiteSpace和Ueinet等[13]。其中,美国德雷塞尔大学计算机与情报学的陈超美教授使用Java语言开发的CiteSpace已经成为引文分析可视化工具的主流软件[14]242-253。CiteSpace是引文空间(CitationSpace)的简称,是在科学计量学、数据和信息可视化背景下逐渐发展起来的一款多元、分时、动态的引文可视化分析软件,可通过对科学文献的分析,展示若干研究前沿领域的演进历程,挖掘引文空间的知识聚类和分布。
三、国内外经管学科大数据研究的知识图谱
下文将基于CiteSpace软件对我国经管学科大数据的文献进行共被引分析(文献和作者)、关键词共现分析,绘制出国内外经管学科大数据研究的知识图谱,并进行比较分析。
(一)国内外经管学科大数据研究的文献共被引分析
文献共被引是指多篇文献共同出现在某一篇施引文献的参考文献目录中,则这多篇文献就形成了共被引关系[15]265-269。共被引的频次越多,说明学术研究方向的关联性越紧密,反映了文献之间共同的研究方向和关注的热点。共被引分析可以分为文献的共被引、作者的共被引和期刊的共被引分析,节点的大小代表文献、期刊或者作者的被引次数,连线的颜色代表首次共被引的时间。
1.国内研究的文献共被引分析。
CiteSpace对国内CSSCI数据库中280篇有关经管学科大数据方面的施引文献进行文献共被引分析,运行数据得到文献共被引网络的节点数为82,网络连线数量为205,密度为0.0617。其中,图中的聚类名称是采用对数似然算法(LLR),通过从关键词中提取名词性术语为聚类命名得到。图中所显示的#0,#1,……代表聚类标号,编号越小则聚类的规模越大(即聚类中包含的文献数量越多)[16],图中的年轮环代表的是这一聚类中某一篇文章的引文历史,年轮环越大代表该篇文献被引用的次数越多,下文其他图形含义亦是如此,故不再赘述。
首先,我国对于大数据的研究从Frankel和Reid[17]30、Lynch[18]28-29的文献开始,在网络购物和云计算等方面,Dean和Ghemawat[19]107-113、Askitas和Zimmermann[20]107-120的研究具有重要的参考价值;其次,经管学科对大数据的最新研究(2015年前后)主要集中于大数据时代和税收治理两个方面,在大数据时代方面的研究,起始时间大约是在2012年,而在税收治理方面的研究稍稍晚于前者,大约在2013年。
最后,大数据的研究已经深入到多个方向,孟小峰等[21]2483-2491的研究对于各个方向的研究起到了纽带作用,而冯芷艳等[22]1-9的研究对于我国大数据、网络购物、云计算、税收治理、公共政策过程和煤炭交易等方面的研究都产生了极大地影响,该文章在国内经管学科大数据的研究中引用频次最高,高达19次。
2.国外研究的文献共被引分析。
CiteSpace对WOS中370篇经管学科大数据方面的施引文献进行文献共被引分析,运行数据得到文献共被引网络的节点数为125,网络连线数量为345,密度为0.0445,(1)首先,国外经管学科对大数据的研究主要集中于公司业绩方面,大数据在该领域的研究始于Weinberger[23]对国外决策系统和社会数据的研究;(2)其次,被引频次最高的文献是Chen等[24]1165-1188、Mcafee和Brynjolfsson[25]60-66两篇文献,均高达79次,两篇文献均是研究公司绩效方面,同时也涉及健康保障、大数据、社会媒体等方面的内容;(3)最后,国外经管学科大数据研究的文献共被引研究分支较多、研究网络较丰富,经聚类后共有9个类别,这些聚类反映出了经管学科大数据研究的知识基础结构及其研究热点,说明经管学科大数据正在迅速发展中。
3.国内外研究的文献共被引对比分析。
为了更加直观清晰地对比分析国内外文献共被引情况,本文在表1中对国内外排名前6的聚类,以及文献共被引频次排名前3的文献进行对比分析。从表1中可以看出:国外经管学科大数据文献的共被引频次在6个聚类中均远远高于我国。如在所有聚类中,国外文献的最高引用频次达到79次,而国内最高引用频次仅19次。国内外文献共被引频次差距巨大的原因在于国内经管学科对于大数据的研究起步较晚,分析较浅显,方法有限,且理论基础也主要来源于国外,现在处于一个缓慢上升期。而国外研究较早,其理论基础和分析方法较为完善,已经逐步进入稳定期。
综上所述:(1)国外经管学科大数据研究涉及的研究领域较广,分支较多;(2)国外在经管学科进行大数据研究要领先于国内,但是我国的研究发展迅猛,有望赶超国外研究;(3)国内经管学科大数据的研究往往偏重于理论方面的定性阐述,而国外研究更多的是着眼于应用方面,文献共被引的结果表明未来经管学科在大数据方面的研究将从最初的理论研究逐渐转向了实际应用。
(二)国内外经管学科大数据研究的作者共被引分析
作者的共被引和期刊的共被引是在论文的共被引基础上衍生出来的一种分析方法。作者共被引时线图能够反映具体时间内一个学者在某一领域的发文量、学术成就和科研能力。因此图中节点的大小代表作者的被引次数,连线的颜色代表首次共被引的时间。
1.国内研究的作者共被引分析。
CiteSpace对280篇有关经管学科大数据方面的施引文献进行作者共被引分析,运行数据得到文献共被引网络的节点数为118,网络连线数量为329,密度为0.0477,(1)经管学科大数据研究相对集中在国家治理、大数据时代、运营管理和组织调整等方面;(2)在这些研究中,大数据专家迈尔·舍恩伯格是国内经管学科进行大数据研究的重要文献作者。此外,涂子沛、冯芷艳、孟小峰和李国杰等人在时线图中的年轮环相对较厚,这代表了这些作者所著文献的引用频次较高,影响力较大,是国内经管学科进行大数据研究的先行者和开拓者。
2.国外研究的作者共被引分析。
CiteSpace对WOS中370篇经管学科大数据方面的施引文献进行作者共被引分析,运行数据得到文献共被引网络的节点数为262,网络连线数量为756,密度为0.0221,
(1)国外从事经管学科大数据研究的学者主要集中于纵向案例研究(longitudinalcasestudy)、潜在利益(potentialbenefit)、公司绩效(firmperformance)、大数据(bigdata)和审计判断(auditjudgment)等方面;(2)国外经管学科从事大数据研究最早源于Mcafee对于纵向案例研究,且该研究对后期的各个方向的研究都产生了深远的影响;(3)国外经管学科从事大数据研究的代表人物主要有Mcafee、Hurwitz和Manyika等,他们的研究均为后续研究奠定了坚实的基础。
3.国内外研究的作者共被引对比分析。
(1)国外从事经管学科大数据研究的学者的文献共被引频次要显著高于国内学者,这说明国外已经具备较好的研究基础;(2)国内外经管学科对于大数据的研究已经开始渗透到各个方向,且每个方向都出现了具有代表性的成果,如国外学者中Mcafee、Davenport和Manyika等的研究,以及国内学者中冯芷艳、涂子沛和孟小峰等的研究;(3)在国内外经管学科对于大数据的研究中,国内文献对于国外文献的共被引较多,然而国外对国内文献的引用也仅限于使用英文发表的文章,且相对要少得多,这也说明国内学者和研究成果的影响力相对较小。
总而言之,国内外学者对于经管学科大数据的研究已经推进到了经管学科的不同研究领域,形成了新的研究热点与方向,为今后的研究奠定了坚实的基础,但是值得注意的是国内学者的研究还存在文献累积不足,影响力局限于国内等一系列弱势因素。
(三)国内外经管学科大数据研究的关键词
共现网络分析关键词是文献计量研究的核心指标,是文章主题和中心思想的反映,是读者进入特定领域进行深入分析的最有效索引[26]95-100,而关键词的共现分析结果更加直观,可以得到研究领域的热点和前沿。
1.国内研究的关键词共现网络分析。CiteSpace对280篇有关经管学科大数据方面的施引文献进行关键词共现分析,运行数据得到关键词共现网络的节点数为43,网络连线数量为73,密度为0.0808,(1)关键词共现网络知识图谱的节点联系紧密,研究主题主要集中于大数据、云计算、网络购物和信息共享等当前经管学科大数据研究的主要方向;(2)围绕着大数据的研究衍生了一系列关键词,包括大数据时代、网络购物和物联网等。
(3)关键词“大数据”在2013年首次出现在国内的研究中,图中的年轮环代表该关键词的共现情况,年轮环每一层的颜色代表共现对应的时间,关键词之间的连线代表两个关键词共现,连线的颜色代表两个关键词第一次共现的时间。
2.国外研究的关键词共现网络分析。
CiteSpace对WOS中370篇经管学科大数据方面的施引文献进行关键词共现分析,运行数据得到关键词共现网络的节点数为193,网络连线数量为573,密度为0.0309,(1)国外关键词共现网络的知识图谱中,节点间的联系非常紧密,研究的主题较集中于大数据项目、账户信息、未来研究和小企业营销等研究方向;(2)从时线图的尾部可以看出:大数据与健康保障、大数据与供应链、数据科学等方面是时下研究的重点;(3)关键词“大数据”出现的时间最早,共现的频次也最高。围绕着大数据研究产生的一系列关键词,包括大数据分析、管理、系统和影响作用等。
3.国内外研究的关键词共现网络对比分析。
结果表明:首先,国外经管学科大数据研究的网络更加庞大复杂,增加了更多可视化的应用,如bigdata(大数据)、knowledge(知识)、analytics(分析)、management(管理)、technology(技术)等;其次,国内的研究大多是偏于理论方面,如大数据、大数据时代、云计算、物联网、国家治理和智慧城市等,显然国外大数据的研究前沿领先于国内[27]131-136;最后,从时下大数据在经管学科的研究热点来看,国外的研究侧重于知识和管理等应用方面,而国内的研究则主要集中在大数据时代和云计算等理论的定性阐述方面。
四、结论与启示
本文运用CiteSpace这一文献计量可视化工具对国内外经管学科大数据研究的文献共被引、作者共被引和关键词共现网络进行对比分析,得到了以下几点主要结论:首先,从论文发表数量的时间分布图可以看出国内外对于经管学科大数据的研究成果均呈现逐年上升的趋势,且国外研究比国内研究更加丰富,管理类的研究成果要比经济类研究成果多,可以预期未来我国对于大数据的研究将会有爆发式增长。
其次,从国内外文献的共被引分析来看,国内经管学科大数据的研究大部分集中在商业领域,而国外经管学科对大数据的研究更多的是与管理学科相关。从国内外作者共被引分析情况来看,国外经管学科大数据研究的方向多样,内容丰富,高被引学者已然成为该研究方向的“领头人”,而国内研究学者的引用次数较少,这主要是因为国内研究的理论几乎都是来源于国外学者的研究,同时国内各行业对于大数据的研究起步较晚,理论、分析方法等方面都存在欠缺的情况。
最后,从国内外关键词共现的分析来看,国内外的研究热点存在较大的差异,国内的研究热点偏理论,包括物联网、数据治理、电子商务等方面,而国外的研究热点则更偏向于应用方面,包括健康保健、管理、组织和分析等。总之,目前国外经管学科在大数据研究方面已经开始趋于成熟,但是随着可视化理论和技术的发展,以及国内研究的大爆发,国内在该方面的研究将会出现长足的发展,未来我国经管学科大数据的研究将逐渐从理论转向实际应用。
管理方向论文投稿刊物:《管理学刊》(双月刊)系经国家新闻出版总署批准(批准文号为新出综合〔2009〕304号),河南省教育厅主管,由新乡学院与中国经济规律研究会共同主办的国内外公开发行的专业学术刊物,现为国家一级学会中国经济规律研究会会刊,河南省一级期刊,由中国社会科学院学部委员程恩富教授担任主编。