时间:2022年06月22日 分类:科学技术论文 次数:
摘要:[目的/意义]为了梳理国内外认知计算的研究现状,分析其在图书情报领域应用状况,为后续认知计算在图情领域应用提供借鉴。[方法/过程]首先利用 CiteSpace 可视化软件,基于文献计量和比较分析的视角综合梳理了国内外认知计算的学科分布与研究热点,然后分析了认知计算在图书情报领域应用现状,最后提出认知计算在图情领域未来实践应用的相关建议。[结果/结论]研究发现:国内外认知计算研究的学科分布呈现跨学科和多学科形态,国内外共同关注的研究热点有人工智能、机器学习、大数据与粒计算。国内形成了认知计算与图情领域相结合的热门研究方向,主要应用于情报检索与分析、大数据处理与知识发现、智能人机交互以及学术论文评价等方面。[创新/局限]借助科学计量工具系统性梳理了认知计算的国内外研究现状,分析了在图情领域的应用现状,提出了未来的应用场景和用途。
关键词:认知计算;CiteSpace;知识图谱;比较分析;图书情报领域
0 引言
认知计算是认知科学的核心技术子领域之一,是人工智能的重要组成部分,是模拟人脑认知过程的计算机系统,代表了一种全新的计算模式[1]。当前以认知计算为核心的新兴智能技术正在持续推动新一轮科技革命的发展,推动人类社会进入人机协同的智能时代。认知计算所具有的辅助、理解、决策和发现的功能开始被重视,并广泛的被应用到商业、农业、医学、图书情报等领域,内外兼具理论深度与现实意义的研究成果呈爆发式增长,引起了业界和学术界的广泛关注。
目前有关于认知计算研究方面的文献梳理,都是聚焦于认知计算某一子领域,未从整体、全局视角对认知计算功能、热点、实践应用等方面进行系统深入的梳理;从研究方法上来看较为单一,以主观内容解读为主,少有研究从科学计量角度对文献进行深入梳理与分析,并且暂无研究从宏观角度对国内外研究现状对比分析,更是少有学者梳理其在图书情报领域的应用。鉴于此,为了更加清晰的梳理和对比国内外认知计算研究的现状和发展脉络,把握其研究热点及应用现状。本文运用文献计量分析软件 CiteSpace 作为研究工具,绘制科学知识图谱对国内外研究现状进行可视化比较分析,了解研究异同并梳理其在图书情报领域应用,以期为未来国内认知计算在图书情报领域应用研究提供思路和建议。
1 数据采集与研究方法
为保证数据的准确性和完整性,本文分别从中外兼具代表性与权威性的数据库中收集了有关认知计算的学术期刊论文,其中中文文献源自中国知网 CNKI,外文文献源自 Web ofScience 核心合集数据库。检索方式分别为:在 CNKI 数据库中,以“认知计算”作为关键词进行主题检索,发文年限设定为 2006 年—2021 年,筛选剔除会议纪要、书刊名称、广告等无关信息,检索得到期刊文献 270 篇。在 Web of Science 核心合集数据库中,构造检索式为“(TS=(cognitive computing or cognitive computation))AND 文献类型:(Article)”,剔除关联较小文献信息后,选取文献共 474 篇。本文选择采用陈超美博士研发的当前学界较为认可的科学计量软件 CiteSpace 作为研究工具。它可以通过生成可视化科学知识图谱生动形象的从海量文献中展现某一学科领域最重要、最关键的信息,梳理其过去和现在的发展历程,识别最活跃的研究前沿和发展趋势。运用 CiteSpace 通过高频关键词统计和聚类对国内外认知计算研究热点进行分析,通过对阶段突变词的分析对国内外发展脉络进行梳理。最后,重点分析认知计算在图书情报领域的应用现状,以期为未来国内认知计算在图书情报领域应用研究提供参考依据。
2 国内外研究发文趋势及学科分布比较分析
2.1 年发文量总体趋势比较分析
通过文献的年度发文量变化图可以了解国内外认知计算研究的产出情况,并在一定程度上可以反映出该研究方向的学术关注度,了解其发展情况并预测其发展态势。
2006 年至 2021 年期间国内学者研究发文数量整体呈现不断增长的发展态势。其中,在 2008 年国家自然科学基金委员会发布了“视听觉信息的认知计算”研究计划,短暂推动了我国认知计算领域的研究发展。2013 年,以“从大数据到认知计算”为主题的认知计算研讨会在北京举行,这一研讨会的举办进一步推动了国内关于认知计算的研究热度;但是之后,文献发文数量也未呈现指数型增加,这说明国内认知计算研究整体还是处于初期探索阶段,遇到了无法解决的技术实践方面的难题或其他瓶颈问题。相比之下,2006 年至 2021 年国外认知计算的论文发文数基本保持指数型持续增长的态势且发文数量高于国内,尤其在 2018 年后差距对比明显。2002 年美国国家科学基金会和美国商务部共同提出“聚合四大科技,提高人类能力”的计划,并把认知计算视作是最优先发展的理论,随之认知计算的研究热度开始增加。2006 年,计算机产业领军者和认知计算的研究先锋 IBM 公司发起了认知计算会议,推动了认知计算的研究。
在 2011 年,IBM Watson参加美国老牌智力问答节目 Jeopardy!打败人类纪录保持者,Watson 作为认知计算的杰出代表及其所具备的认知智能开始受到关注,国外对于认知计算研究进入迅速增长阶段。2016年也是一个重要转折点,2016 年 3 月 AlphaGo 打败李世石,基于深度增强学习和神经网络算法的认知计算成为学术界和业界关注焦点,使得国外认知计算的研究发文量呈现指数型增长。
2.2 学科分布比较分析
学科分布能够在一定程度上反映作者研究视角和研究方法,由学科分布也可以了解某一研究领域的知识基础。统计梳理认知计算的国内外相关学科分布发现:认知计算研究的学科分布呈现跨学科和多学科形态,计算机科学文献的比例占据绝对优势,另外神经科学、工程学、电信技术、心理学相关学科的文献量也相对较多;从学科整体发展趋势来看,从最开始的计算机科学等少数学科,到现在包括心理学、电子通信技术、医学等众多学科,这说明认知计算的研究是建立在跨学科基础上的综合性研究,是以现代自然科学的观点,结合计算机科学、神经科学、心理学等多领域学科的综合性科学;当前认知计算领域广泛借鉴并引入其他学科的知识作为其基础,其中涉及到的理论学科主要有计算机科学、神经科学、心理学等;涉及到的应用学科主要有电子通信、教育学、医学、农学、图书情报等,认知计算作为一项新兴技术向更多领域融合也成为未来趋势。
3 国内外研究热点主题比较分析
3.1 高频关键词分析
关键词是文献内容的精炼与核心观点的标识,是对一篇文献精髓内容的总结概括。梳理分析研究领域内高频关键词可以帮助我们了解领域内的研究重点。在 CiteSpace 中选择Keyword 功能,策略选择 Top 50。
为了更清晰展现高频词,对比国内外研究差异,整理国内外高频词分布对比表,见表 1。国内研究中出现频次较高的关键词有人工智能、云计算、认知、大数据等,国外研究中出现频次较高的关键词主要有 model(模型)、system(系统)、artificial intelligence(人工智能)、machine learning(机器学习)、big data(大数据)、管理(management)、算法(algorithm)等。关键词大致分为以下三个类型:第一类是宏观理论概念主题,包括认知计算、人工智能、认知、认知科学、计算主义等,该类关键词基本上是对认知计算关键概念和基础理论的宏观描述,具有高度理论性和概括性。第二类是认知计算技术方面,包括云计算、机器学习、粒计算、深度学习、神经网络、算法等关键词,技术的发展是促进认知计算研究持续深入的最大动力。第三类是认知计算的应用与服务方面,包括 IBM、物联网、模型、系统、管理、风险预测模型、图像识别、情感计算、知识服务与管理、认知情报学、教育信息化、医疗决策等,也是当前认知计算研究中比较热门的方向。
3.2 国内外研究热点聚类分析
通过 CiteSpace 软件关键词聚类功能运用 LLR 算法从关键词中提取名词性术语,实现对聚类的命名,由此得到国内外认知计算研究主题聚类。图谱参数显示,两个聚类图谱的聚类模块值 Q 均大于 0.7,远远大于 0.3 的临界值,表示聚类图谱结构显著;且聚类平均轮廓值 S 大于 0.5 的临界值,表示聚类结果合理。粒计算是起源于人工智能、机器学习、数据挖掘与智能系统的一个新兴的、多学科交叉的研究领域,是当前计算智能研究领域中模拟人类思维和解决复杂问题的新方法。它覆盖了所有有关粒度的理论、方法和技术, 是复杂问题求解、海量数据挖掘、模糊信息处理的有效工具[2]。
自 L.A.Zadeh 教授于 1979 年提出并讨论模糊集与信息粒化后,国内研究人员对信息粒度化的思想产生了浓厚的兴趣,出现了王国胤、米允龙等研究学者。目前国内粒计算的研究也越来越广泛,在粗糙集与软计算、粒计算理论与应用以及三支决策模型与分析等方面都有很大成果,特别是在涉及处理模糊、不确定、精确度低的模糊数据方面具有明显的优势,提高了机器学习的效率,在图形图像处理、文本分类、医疗决策、人脸识别以及航空、生物、农业等方面都有所应用。国外也有学者将粒计算与认知概念结构相结合,提高了概念学习的效率。国内研究热点主要围绕以下 6 个方面展开:
(1)认知计算在人工智能领域应用,主要包括聚类#1 人工智能,主要关键词有神经突触、国际象棋、科大讯飞、智能语音、预报预测、人脸识别等。人工智能旨在代替人类行使智能行为和决策,但是人机之间可能会存在冲突,而认知计算能够模仿人类的思维和过程,辅助人类进行决策。发源于人工智能的认知计算在很大程度上有助于人工智能研究成果突破。目前我国关于认知计算在人工智能领域的研究主要在一些新兴技术的应用探索上,比如将认知计算应用于智能语音、人脸识别、气象预测、医疗诊断等领域已经取得进展[3]。
(2)人类认知方面研究,主要包括聚类#0 认知计算,#2 认知,#9 认知水平。该聚类包含主要关键词有情感计算、心理模型、人机交互、涉身认知科学、具身认知、认知困境、信息建构等。认知是人类观察世界、理解世界、改造世界的完整过程,认知科学是研究人类认知的本质及规律,揭示人类心智奥秘的科学[4]。认知计算作为认知科学的研究方向之一,国内认知计算的研究注重以人为中心,构建认知对象、认知架构和认知模拟三者统一的认知模型,研究认知过程中对认知数据进行处理的全部算法,也包括从人的认知过程中进行情感计算、分析情绪反应和情绪状态。
(3)云计算方面。主要包括聚类#3 云计算。该聚类包含主要关键词有并行计算、媒体神经认知计算、计算机、网络安全、云安全、分布式计算等。云计算是智能认知服务的基础,作为大型认知计算系统的底层设施平台,它的弹性、扩展性和高度分布式特点使认知系统实现了具备高效利用数据资源和实现复杂算法的能力,其中可穿戴设备等人体局域网的产生也促进了云计算的发展。另外云计算背景后的网络安全与管理问题也越发受到国内学者的重视。
(4)大数据挖掘与分析方面。主要包括聚类#4 大数据分析,#8 数学能力。该聚类包含主要关键词有医疗大数据、基础架构、社交媒体、大数据平台、细胞自动机等。大数据分析属于认知计算的一个维度,实现更高质量的数据分析也是认知计算的目的,包括大量非结构化数据的分析以及构建大数据分析平台、构建风险预测模型等[5]。目前国内有比较成熟的医疗大数据分析系统进入到医疗健康领域,在精准计算患者临床数据、为患者提供个性化治疗方案等方面有所应用。
(5)认知计算在智能汽车和交通运输领域应用。主要包含的聚类是#6 高速公路。该聚类包含主要关键词有前置距离、生物视觉机制、计算视觉理论、视觉认知、高速公路、神经影像等。这一聚类主要针对国家自然科学基金委员会提出的“视听觉信息的认知计算”重大研究计划,集成视听觉信息方面的研究成果,结合有关驾驶行为的认知机理等,进行无人驾驶车辆等相关方面的研究[6]。(6)机器学习方面。主要包括聚类#7 机器学习。
该聚类包含主要关键词有深度学习、人工神经网络、稀疏编码、学习干预、脑机结构、自适应学习、自然语言等,主要是探讨运用机器学习算法实现认知计算功能。国内学者将稀疏编码与认知计算相结合,并形成稀疏认知计算模型。近年来得益于计算机性能的提升和云计算技术的发展,深度学习的概念从国外被引入并作为一种新的机器学习方法,成为认知计算的研究热点,深度学习的效果超过了原来的概念学习,提升了机器对数据的认知能力,是机器学习的一个重大突破。其中数据表示是深度学习的基础,认知模型的构建是其关键,高性能的并行计算是其保证,因此国内的研究也多从这三方面展开[7]。国外研究热点主要围绕以下方面展开:边缘认知计算方面。
主要包括聚类#0 边缘计算(edge computing)。边缘认知计算是一种将认知计算应用于网络边缘的新的计算范式,通过提供用户认知和网络环境信息,进而提供弹性认知计算服务,实现比边缘计算更好的用户体验。其与云计算是相互补充、互相依赖的关系,边缘计算是云计算的进步与延伸,将云计算的能力向边缘延伸,具有低延迟和高用户体验的特性,能够降低成本、提高效率。神经系统方面,主要包括聚类#3 神经系统(neuromorphic system)。这一聚类主要体现国外认知计算研究中重点关注机器学习中的深度学习算法。
通过关注人类视觉、听觉、记忆等行为的变化,探寻大脑内部信息处理机制和过程,由此揭示人类处理信息的过程。由最早的神经网络算法来模仿人类大脑,到使用多层神经网络结构来模拟人脑分层信息处理的深度学习算法,再到最新提出的卷积神经网络、尖峰神经网络,国外认知计算的研究强调在不断迭代学习过程中提高准确性。认知计算在医疗领域应用方面,主要包括聚类 #4 轻度认知障碍(mild cognitiveimpairment)。随着认知心理学等领域研究成果的不断发展,逐渐开始深入研究人类内部心理和认知过程,产生了认知诊断这一新的心理测量理论。这一领域主要涉及关于医疗保健、卫生系统、个性化医疗、处理大量医疗非结构化数据并将其研究成果应用于临床研究中,其中也包括在对于阿尔茨海默病等人类认知障碍疾病的治疗和诊断方面有较大研究进展。认知计算在农业领域应用,主要包含聚类#6 定量计算(quantitative calculation)。这一聚类体现出农业领域是国外认知计算的一大应用方向。
为了实现智慧化农业,对农业生产的全过程提供智慧的支持与服务,离不开计算的帮助与支持。规模化的农业生产与个性化的农业需求是目前智慧农业需要解决的主要矛盾。目前认知计算在农业领域的应用包括智能采集和处理农业生产中的大规模非结构化数据、定量计算精准灌溉量、为人类提供预测决策支持等,依据不同生产场景决定相应技术的情景化、重视农业生产中的个性化、以大数据和物联网等技术支持下的学习分析技术为支撑的数据驱动是其主要特征。同时这也需要农业领域专家和计算机领域专家进行合作,构建智能的农业生产模型,综合考虑选择最合适的生产策略。图像识别方面,主要包含聚类#7 图像识别(image recognition)。
近年深度学习理论的不断发展,计算机在视觉识别、语音识别、自然语言处理等很多领域达到甚至超过人类水平,其中图像识别是认知计算的一个主要应用领域。机器通过深度学习进行图像识别与分类时,模仿人类图像识别的感性方法,通过大量的图像数据学习,获得图像与结果之间的映射关系。国外主要将其技术应用于医疗认知系统和医疗图像分析中,以及建立相应的预测和分析模型,已使用卷积神经网络、卷积自编码、自编码器等方法对图像进行识别与分析[8]。智慧家居方面,主要包含聚类#8 智慧家居(smart home)。
认知计算等新技术的出现,引起人类的生活方式也发生了巨大的变化,未来的个人生活将会更加向“差异化”和“个性化”方向发展。智慧家居是认知智能机器人广泛应用的体现,认知智能机器人要求借助脑科学和类人认知计算的方法,通过云计算、大数据处理等技术,增强机器人感知、环境理解和认知决策能力。智能家居机器人通常能提供智能家居控制、接收语音指令、实时监控及时预警等功能。随着机器人加入人类认知后,传统的智能家居系统开始进化成具有认知情感智能的新一代智慧家居系统,除了传统功能外还能通过感知用户情绪来调节环境,实现优化用户情绪的功能。通过国内外研究热点之间的对比分析发现,目前国内外关于认知计算的研究有一定的差距。一方面在认知计算的底层架构和基础设施的建设方面,云计算和分布式架构作为大型认知计算系统处理庞大数量异构数据所不可或缺的底层设施,需要不断进行扩展,目前国外已进入到有关边缘计算、雾计算等领域,而国内对云计算的延伸这方面的研究刚刚开始。
另一方面在认知计算的相关算法和计算力方面,国外学者坚持不断完善与创新算法,推动算法在实践领域得到应用,国内在纯算法研究方面还有待提高与进步。从理论与实践应用的视角来看,国内目前还是注重认知科学等基础理论方面研究,应用研究则与国家政策的出台有较为密切的关系,在国家大数据战略、建设智慧中国的政策背景下,应用研究热点主要集中在大数据分析、医疗健康以及视听觉信息识别等方面。国外理论研究热点主要集中在边缘计算、深度学习算法等方面,与国内应用相比研究热点更加广泛,包括在智慧家居、金融风险预测、医学临床诊断、农业环境监测等领域都有所应用,更加注重认知系统的研发。
4 国内外研究主题的演化路径比较分析
关键词突现度可以反映一段时间内影响力较大的研究领域。通过 Burstness 进行突显词检测,国内外认知计算领域文献突显关键词,共检测到国内研究突显关键词 13 个,国外研究突显关键词 21 个。通过对关键词突显图谱进行分析,可以把认知计算的研究分为三个阶段。第一阶段为2006—2011 年的起步阶段,重点在于理论基础研究;第二阶段为 2012—2017 年的高速发展阶段,实现技术进步和突破;第三阶段为 2018—2021 年的平稳发展阶段,关注实际应用。结合中外文献国内外分阶段对比分析结果如下:
(1)2006 年—2011 年萌芽阶段,这一阶段国内的研究成果比较少,出现的突显词有认知科学、计算主义等。此阶段国内学者对于计算主义“认知可计算”观点的正确与否存在争议。例如:商卫星等认为计算的观点有其无法克服的局限性,并非人类思维和智能的所有方面都是可计算的,否认计算主义算法万能的观点[9]。任晓明肯定了派利夏恩计算主义理论的基本观点,即人就是一部逻辑机器,认知的本质是计算,一切认知过程和智能行为都是可计算的[10]。同时该阶段国内属于认知科学向认知计算演化的阶段,主要从哲学、心理学视角研究人的认知过程,与认知科学相结合,形成了一系列认知计算模型,比如视觉认知计算模型、情感计算模型等,并逐渐开始转向相关技术的研究。例如:郦全民从哲学角度和关于计算的普遍原理出发,在具体研究认知系统的计算特性的基础上建构起关于认知的计算理论,并获得认知等价原理、认知模拟原理和认知不可归约原理三个支配认知过程的基本原理[11]。
另外,关于粒计算的研究也从这一时期开始。张文修等提出基于粒计算的认知计算模型,建立了认知的粒化描述,通过概念的形成过程较准确的描述了人类的认知过程的本质[12],并将粒计算的认知模型引入并用于分析图像认知过程[13]。此外,王慧强等开始针对物联网的关键技术和应用开展研究,其中包括认知计算与智能控制技术、网络融合技术和纳米技术等,引发了下一阶段大量学者对认知计算中重要技术支撑的研究[14]。然而,这一阶段国外在理论研究有较大进展的同时,已经进入到认知计算的实践领域。在理论方面学者对人类大脑进行建模,建立了从感觉、记忆、感知、行动、元认知和更高的认知层六个层次的大脑分层模型,对认知信息学中生理、心理和认知现象的计算解释具有一定的理论基础。在实践应用中,学者们将认知计算相关技术进行在医学、图像处理等领域实践应用,例如:L.Ogiela 等研究了认知计算在智能医学模式识别系统中的应用,将认知计算应用于语义解释的相关任务[15]。
E.I.Papageorgiou 等采用无监督学习算法 AHL 和模糊认知图来表示和建模专家知识,提出一种肿瘤认知和分类诊断决策系统,具有较高的准确度,成为日常临床实践中的工具[16]。W.Pedrycz 针对认知地图的设计和形成地图的算法进行了研究和探讨并用遗传算法的方法构建模糊认知图[17]。A.Chohra 等对已有故障诊断系统的研究进行了简要的综述,并且从信号表示和图像表示两个方面提出一种混合的智能诊断方法,能够在医学领域计算机辅助诊断中得以应用[18]。此外,还有学者开始开展机器人与认知系统融合方面的研究,基于大脑的分层参考模型描述了认知机器人的体系结构模型,以及从认知机器人的一般行为模型和行为过程之间的层次关系出发,阐述认知机器人的行为模型并提出一种认知机器人参考模型,在机器人认证、计算智能和自动化系统中有应用前景。
(2)2012 年—2017 年起步阶段,这一阶段国内的研究文献数量开始增多,先后出现物联网、云计算、机器学习、非结构化数据等突显关键词,但突显时间都比较短,可以发现这一阶段国内的研究主要集中在认知计算的几个重要技术方面。认知计算是基于云计算、物联网、5G 网络、人工智能、大数据分析等技术上发展起来的智能应用,其中物联网提供了认知计算所需要的信息源基础,包括各种结构化数据和非结构化数据。同时,该阶段也开始将认知计算技术进行应用实践。例如:认知计算技术与社会的转型和对接,能够进入认知商业,实现解决智能语音、智能医疗等领域的问题[19][20]。唐新晨基于机器学习构建了基于认知计算的就业咨询智慧服务系统,为应届生选择求职方向作出正确决策[21]。杨娟结合机器学习构建了认知计算在教育领域的模型,开发了基于案例推理机器学习的配置模型工具[22]。国外这一阶段的研究成果主要体现于认知计算技术实现方法,其中在粒计算的研究有突破性进展,例如:J.Li 等提出了通过粒计算进行概念学习的认知观点,从哲学和认知心理学的原理出发,分析了概念形成的认知机制,提高了概念学习的效率[23]。
Y.Zhao 等通过研究提出认知概念学习的方法,即通过模拟人类思维过程,从给定的线索中学习概念[24]。实践方面的研究主要集中在认知智能系统开发,例如情感认知系统、各类智能系统、医疗认知训练系统、自动驾驶系统等。例如:M.Tarafdar 等概述了企业认知计算应用程序,认为企业认知计算应用程序使业务流程更加高效和准确,推动企业良好运营,并描述了实施过程中的挑战[25]。E.Mezghani 等基于认知物联网系统的复杂性和对大数据和异构数据的管理,构建了能够感知收集数据并提供灵活决策的智能物联网系统,并将此系统用于开发基于异构可穿戴设备的认知检测系统来管理患者健康[26]。另外认知计算在图像识别领域也有一定进展。S.Zhang 等指出采用 ICA 算法的图像特征提取方法存在计算代价过高的问题,提出将 ICA与 ELM 算法相结合的图像识别认知计算方案,并将此方案应用于人脸识别[27]。
(3)2018 年—2021 年发展阶段.该阶段国内的研究主要是将理论与各种实践相结合,尝试将其应用于教育、医疗、农业等领域,并逐渐向更深层次的文本挖掘、语义推理、智能问答等方面发展。信息融合系统是国内认知计算的一个研究前沿,目前已有学者提出基于卷积神经网络的认知智能信息融合系统体系结构,使用认知计算分析智能信息融合应用程序收集与处理数据,解决了当下数据智能采集中可扩展性和灵活性差的问题[28]。另外,认知计算在农业领域的应用也是国内一个研究热点。魏浩冉以综述的形式分别分析了人工智能在农业领域主要应用技术、应用现状及其制约因素,并指出农业认知计算系统以有限的人力收集、处理和理解大规模数据,减少人力参与农业工作,提高工作效率,协助农业生产和贸易活动,应用前景十分乐观[29]。认知计算和农业大数据的结合有效促进了智慧农业的发展[30]。
除此之外,作为突显程度最强且持续至今的认知情报学也表现出认知计算将会在图书情报领域带来新机遇,为知识服务的创新提供新思路。国外这一阶段的研究注重认知算法和认知模型应用创新,在物联网和云计算的基础上开展对边缘认知计算的研究。例如:F.Fotis 指出传统的云计算不能满足高实时、低延迟的要求,因此提出了边缘计算的一种新的雾计算范式并应用在工厂预测性维护中,为物联网边缘架构存在的问题提出了解决方案[31]。J.H.Park 等基于对认知物联网进行研究,提出智能城市网络的体系架构,能够利用认知计算分析从该系统中收集到的数据并解决了数据采集可扩展性和灵活性等之前未能解决的问题[32]。同时在继续深入智能系统开发和算法的研究中形成了一些新的认知系统,比如餐饮客流量预测系统、商业客户概况系统、司法判决系统、地理信息系统等。
5 认知计算在图书情报领域的应用概述
在我国新一代人工智能发展战略框架下,图书情报领域在以用户服务为导向、推动服务及应用向人类智慧化发展的目的下,逐渐将大数据、互联网、云计算等新理论和新技术与图书情报深度融合,未来也会将认知计算的一系列技术引入图情领域,发挥认知计算在辅助、理解、决策、发现等方面的优势和潜能,并且其在情报分析、情报检索、数字图书馆等领域具有很大的研究前景。由于目前认知计算技术尚未成熟、认知计算在图情领域的应用也依旧处于初级阶段。但相关部门和越来越多领域内学者已经开始关注并致力于研究认知计算技术在图情领域的应用实现,从理论与技术层面对这一目标的实现做出贡献。2009 年美国的 IEEE 召开第一届认知情报学国际年会上正式提出“认知情报学”这一认知计算与图书情报学交叉结合的新概念与新研究领域。作为新兴且交叉融合了计算机科学、认知科学、情报学、心理学等不同领域的认知情报学迅速受到国内学者的关注。
布鲁克斯情报科学基本知识方程、贝津的“知识非常态”理论、德文的意义建构理论等基于认知科学的情报科学理论为认知情报学的发展起到理论支撑的基础作用。国内学者徐峰首次将认知计算引入图书情报领域,认为认知计算的发展将会对情报检索技术、信息组织及情报分析方法与技术等领域的发展产生深远的影响[33];严贝妮等论述了认知情报学产生的必然性,后详细阐述了认知情报学科的理论框架,包含理论研究、数理研究、应用研究三个方面[34]。王祥丽介绍了认知计算在图书情报学中的具体应用场景[35]。最近几年,也有部分学者梳理了认知情报学的缘起和发展脉络[36],并对认知情报学的国内外研究现状进行了可视化分析,以期激发学界对认知情报学领域的关注与兴趣,推动国内相关研究的深化发展[37]。
5.1 认知计算在图书情报领域应用维度
国外学者 Paul Roma 细分了认知计算的三种主要应用方式,分别是认知自动化、认知洞察力和认知参与,这一应用角度被广泛认同并借鉴于认知计算在图情领域的应用中,目前认知计算在图书情报领域的应用也从这三个维度展开。认知自动化为大数据情报分析提供解决方案。大数据时代中的情报检索工作往往会出现大量数据闲置没有很好利用的状况,认知计算则可以通过整合海量数据资源实现数据资源的有效利用。随着数据产生与更新的速度越来越快,传统人工情报分析不再能满足用户的需求,认知计算的自动化特征可以通过从互动中、从环境中不断学习的方法,模拟人类认知思维,自动且高效的对大量数据进行分析处理,并产生较为科学的决策建议。
另外,目前需要分析利用的大数据逐渐由单一的结构化数据趋向各类图像、音频、视频等非结构化富媒体数据,而认知计算中的计算机视觉技术、音频处理技术以及自然语言处理技术等能够实现对大量非结构化数据的分析和跨数据类型的检索。认知洞察力重新定义知识发现。基于自然语言处理的知识挖掘与知识发现在情报分析工作中处于越来越重要的地位,如何摆脱传统的检索浏览信息服务阶段进入到知识增值服务阶段、如何自动挖掘并提取非结构化大数据中的深层含义并形成人类的智慧也是目前的一大难题。目前非结构化数据占到所有数据的 80%,已出现社交媒体分析、文本挖掘、观点分析、地理空间分析等专门处理非结构化数据的技术。目前,国内图情领域学者也开始运用认知计算的认知洞察力开展知识发现和组织工作。
例如:孙坦等学者通过研究和实验发现基于传统知识组织构建方法和基于深度学习的方法都无法实现精准的知识发现,并因此提出了融合知识组织与认知计算的新一代开放知识服务系统,分析其所需的相关技术,这一研究成果对重新定义知识发现具有重要指导意义[38]。认知计算具有高度的洞察力,能通过机器学习、自然语言检索、文本语义挖掘、智能推理等相关技术模仿人类认知思维过程,实现基于语义和基于内容的信息组织与知识挖掘,并通过对某一特定领域内的知识进行训练,在人机交互和环境中不断迭代学习,实现细粒度实体层面和整个结构层面的自动知识发现。然而在知识发现中,不同行业、不同学科的自然语言处理是认知计算面临的挑战之一。
目前自然语言处理却存在着诸如中文文本分析中同义词、同音异义词难区分、多义词具体含义难以确定以及对标注数据依赖性较高、需要耗费大量的数据资源进行训练、缺乏独立的运用场景等问题。这一问题的解决一方面需要构建该领域足够充分的语料库,选择合适的训练数据,从质量和数量上保证数据的准确性和可用性,另一方面在构建知识组织体系时,尽可能尝试或结合不同的知识组织方法和不同的搜索引擎、关键词抽取的算法,将机器学习和深度学习技术更好的与图情领域相融合。认知参与搭建新型的人机交互环境。在信息技术的推动下,图情领域的许多服务场景都依赖于智能的人机交互,从人工参考咨询到智能咨询问答平台,从人工管理到无人化智能服务方式,以及智能搜索、智能导航系统的出现,认知计算技术的应用通过构建新型人机交互环境开创了新的服务方式。
在不同的领域构建专家系统也是重要应用之一,认知计算基于机器学习、信息检索、专家经验与自然语言处理等技术,通过将专家级别的理解能力与解决方案植入到与用户的交互中,直接为用户提供高效且科学的决策方案,这一系统使认知计算技术从理论实验走向实践,可以大大降低人工成本的同时满足用户情报检索与情报分析的需求,目前已成熟应用于网络教育、医疗健康等领域之外,在图情领域文献分类、编目、图书馆管理等方面也开始应用。随着认知计算应用的逐渐深入,我们也需要意识到认知计算只是人类的一个工具,通过不断训练、优化和人机协同来辅助人类决策,最终实现为用户服务的目标,是永远不能代替人类智慧的。另外在人机交互的过程中难免会涉及到用户隐私与安全的相关问题,也存在着用户隐私信息被盗取的风险,因此要更加注重信息安全问题,利用数据脱敏技术降低隐私泄露风险,保护用户个人隐私,做好检测、预警等用户信息保密工作。
6 结语
本文从年发文量、学科分布、研究热点和演化趋势等方面对国内外认知计算的研究开展可视化比较分析,并对认知计算在我国图书情报领域的应用现状、前景和建议方面进行了探究。以期为我国学者将认知计算应用于图情领域提供参考依据。结合国内外研究的进展与前沿,未来我国认知计算研究首先应该注重基础理论研究,不断完善与创新算法,提升计算能力。算法和计算力是认知计算发展的强大驱动力,目前国内在纯算法的研究上还有待深入,争取实现技术性的突破。其次,加快认知计算在实践领域的应用,推动从模型构建走向实际的问题解决。
模型的构建是对实践应用的归纳和总结,但研究不能仅停留在理论模型构建的层面而缺乏具体应用研究,因此需要推动研究成果从理论到实践的转变,向多元化和纵深化发展。另外,还需要关注认知计算带来的安全隐患。随着大数据时代的到来,对于用户和个人数据的隐私也渐渐成为关注的话题,发展和使用认知计算的同时应注重数据管理、隐私保护、算法偏见等技术上不可回避的问题。因此相关部门要关注到认知计算可能带来的负面效应和社会问题,做好治理工作,关注数据管理,保证算法透明性,建立健全审计与问责机制等,另外也要注意解决技术所带来的社会安全与伦理问题,推动认知计算在国内实现安全发展。
参考文献
[1] 陈敏.认知计算导论[M].武汉:华中科技大学出版社,2017.
[2] 王国胤,张清华,胡军.粒计算研究综述[J].智能系统学报,2007(06):8-26.
[3] 王志宏,杨震.人工智能技术研究及未来智能化信息服务体系的思考[J].电信科学,2017,33(05):1-11.
[4] 冯康.认知科学的发展及研究方向[J].计算机工程与科学,2014,36(05):906-916.
[5] 米允龙,米春桥,刘文奇.海量数据挖掘过程相关技术研究进展[J].计算机科学与探索,2015,9(06):641-659.
[6] 王国胤,陈乔松,王进.智能车技术探讨[J].计算机科学,2012,39(05):1-8.
[7] 陈伟宏 , 安 吉 尧 , 李 仁 发 , 李 万 里 . 深 度 学 习 认 知 计 算 综 述 [J]. 自 动 化 学报,2017,43(11):1886-1897.
[8] Chen L , R Zhang, Ahmad A , et al. An image super-resolution method forbetter cognition of images in cognition computing system[J]. Journal of Intelligent and FuzzySystems, 2020, 39(6):8043-8055.
[9] 商卫星.科学认知与计算主义的反思[J].青海师范大学学报(哲学社会科学版),2007(01):39-42.
作者:刘爰媛 郭顺利 房旭辉