时间:2021年12月25日 分类:经济论文 次数:
摘要:传统依靠人工经验的作物病害识别方式难以适应大规模种植环境,迫切需要寻求新的解决方案。近年来,人工智能技术在许多领域取得了丰硕成果,在作物病害识别领域也取得较好的效果。为深入了解人工智能技术在作物病害识别领域中的研究现状,该文主要从传统的机器学习方法和深度学习方法个角度分析人工智能技术在作物病害识别领域的研究进展,包括这种方法的技术理论、主要工作流程、应用现状及优缺点,同时展望了人工智能技术在未来作物病害识别领域的发展趋势。
关键词:植物保护;病害识别;人工智能;机器学习
作物病害是导致粮食减产的主要因素之一,准确高效的识别作物病害并实施精准防治是现代农业发展急的主要趋势之一(Manavalan,2020)。及时识别作物病害不仅可以对其实施有效控制,也可以为后期精准施药技术提供数据支撑,减少用药量,保护生态环境(Indrakumarietal.,2021)。传统的病害识别方法主要由植物保护专家根据自己的经验和作物病害特征做出判断,但这种方法受个人经验、作物生长阶段和天气条件等因素影响,难以达到理想的识别效率和准确度(Singhetal.,2020)。
特别是大规模种植过程中,传统的肉眼识别作物病害的方法需要消耗大量的人力物力和时间成本,难以全面推广。随着人工智能技术在自然语言处理、智能交通和人脸识别等领域大规模应用,研究人员开始探索利用人工智能技术识别作物病害,以便早发现早干预,减少病害造成的减产等损失(Piconetal.,2019)。人工智能的概念源于1956年的达特茅斯会议,随后引起了各国政府机构、工业界和学术界的极大关注。人工智能技术可以使人们从繁重的劳动密集型工作中解放出来,特别是深度学习的出现,进一步加速了人工智能相关应用的落地进程。随着人工智能技术的进一步发展,逐渐衍生出机器学习、推荐系统、自然语言处理及图像识别等多个分支。
其中机器学习是实现人工智能的主要方法,也是发展最迅速的方法之一,目前人工智能的主要分支以及常用的机器学习方法如图。国内外研究人员尝试利用人工智能技术发展现代农业,加速农业人工智能相关成果落地(Zhangetal.,2020),主要工作包括作物病害识别、病斑检测、作物生长态势感知和产量预测等。人工智能技术能够将人工提取的作物病害特征(传统机器学习方法)或自动提取的特征(深度学习方法)输入到分类器训练模型,利用交叉验证等方法来评估分类器的性能,通过参数调试等过程使模型效果最优,进而可以预测作物的未知病害类型,达到病害识别目的。为更加清晰了解人工智能技术在作物病害识别领域中的研究进展及应用现状。
本文梳理了人工智能相关技术,对这些技术在作物病害识别的研究现状进行了总结,从常用的机器学习方法——传统的机器学习方法和深度学习方法入手,分析不同方法的原理及在作物病害识别中的应用现状,对不同作物病害识别方法的优缺点及适用场景进行分析,并对基于人工智能的作物病害识别进行展望,旨在推动人工智能技术在作物病害识别领域相关研究,为高效、准确、绿色识别作物病害提供理论依据和实践指导。
1基于传统机器学习的作物病害识别方法
1.1传统机器学习方法及算法流程
常用的传统机器学习方法有支持向量机(supportvectormachine,SVM)(Druckeretal.,1999)、近邻算法(nearestneighbor,KNN)(Bochieetal.,2021)、决策树(decisiontree,DT)(Safavian&Landgrebe,1991)、卷积神经网络(convolutionalneuralnetworks,CNN)(Guetal.,2018)、朴素贝叶斯算法(Jiangetal.,2009)、均值聚类算法(Fosteretal.,2019)等。患病作物首先会在叶片上出现与健康作物不同的视觉特征,目前多数作物病害识别工作都是针对作物叶片特征开展(Singhetal.,2020),也有部分研究人员从作物冠层特征识别病害(刘琦等,2018a;Chenetal.,2019)。传统机器学习算法结合计算机视觉技术在作物病害识别应用中的主要流程包括图像获取、预处理、特征提取、模型选择与分类等。
1.2传统机器学习方法在作物病害识别中的应用进展
传统机器学习算法由于其鲁棒性强和对计算资源要求低的优势在相当长时间内占据主导地位,即使在深度学习如火如荼的今天,传统机器学习算法在病害识别领域仍具有广泛的应用价值(Lietal.,2020a;胡小平等,2021)。这些经典模型在作物病害识别应用中发挥着至关重要的作用,通过提取作物病害的不同特征,并选择合适的机器学习方法进行病害识别(Neelakantan,2021)。在粮食作物病害识别研究中,小麦、玉米和水稻病害是研究人员较为关心的研究对象(Manavalan,2020)。
小麦白粉病、赤霉病和黑穗病是影响小麦产量的种主要病害。在小麦白粉病研究中,Zhaoetal.(2020)提出了一种基于高光谱图像的白粉病严重程度分析方法,该方法设计了一种识别和评价小麦白粉病严重程度的模型,具体包括高光谱图像采集、预处理、特征波段选择和模型选择等步骤,通过比较主成分分析(principalcomponentanalysis,PCA)、随机森林(randomforest,RF)和概率神经网络种方法构建识别模型,利用PCA降维后结合SVM模型在测试集上识别准确度高达93.3%,高于原始高光谱88%的识别准确度。由于赤霉病具有较强的传染性,对种子质量影响非常大,刘爽(2019)对小麦赤霉病开展了深入研究,提出了一种基于高光谱图像技术与SVM相结合的病害识别模型,在不同光谱反射区间内选取更合适的特征信息,识别准确度高达90.18%。
作物病害一般是由各种病原菌引起,因此,识别不同病原菌对控制作物病害有重要的研究价值,Zhaoetal.(2019)针对引起小麦黑穗病的种病原菌——小麦光腥黑粉菌Tilletiafoetida、小麦散黑粉菌Ustilagotritici和小麦秆黑粉菌rocystistritici的鉴定方法进行了研究,利用近红外线技术采集种病原菌端孢子样品,利用区分偏最小二乘法(distinguishedpartialleastsquares,DPLS)、反向传播神经网络(backpropagationneuralnetwork,BPNN)和SVM等方法在不同光谱区域建立识别模型,DPLS和SVM识别达到理想效果。
刘琦等(2018b)针对小麦条锈病潜育期开展定性识别,结果显示基于Randomcommittee方法所建模型的效果最好。此外,传统机器学习方法如KNN和人工神经网络(artificialneuralnetwork,ANN)等在小麦病害识别、霉变程度分析等均效果较好(Neelakantan,2021;Wangetal.,2021)。
在水稻和玉米等作物病害识别方面,传统机器学习方法也有着广泛的应用。由于水稻稻瘟病具有传播速度快,致病严重等特点,对其进行病害识别尤为重要(Yan&Talbot,2016)。Xiaoetal.(2019)和Fengetal.(2020)从多种角度提取稻瘟病叶片病害特征并进行识别,取得不错的效果。Yangetal.(2020)利用衍射图像的光场和纹理特征提取稻瘟病病原菌孢子视觉特征,将其输入到分类器进行病害识别,这种方法可以鉴定稻瘟病早期病害,为及时干预赢得良机。传统机器学习方法结合图像原始特征如直方图在水稻病害识别应用中也取得了较好的效果,如马超等(2019)提取复杂环境下水稻病害图像的梯度直方图特征,并将其输入到SVM中进行水稻病害识别,准确率高达94%。
在玉米病害识别方面也有一些进展,如Wangetal.(2020a)通过图像分割方法提取玉米叶片病害部分,将其作为图像预处理单元,输入分类器利用预处理单元对其病害进行预测。除粮食作物外,传统机器学习方法在经济作物病害识别方面也取得了较好的效果。辣椒是日常餐桌上不可或缺的调味品,但其种植过程饱受病害困扰。AhmadLotietal.(2021)采集了974张种类别的辣椒病害图像,分别采用SVM、随机森林和人工神经网络进行分类识别,经对比分析SVM以92.1%的识别准确率获得最优。
此外,KNN、SVM和BPNN等技术在番茄(Thangarajetal.,2021)、大豆(Araujo&Peixoto,2019)、棉花(Jinetal.,2013;郭伟等,2021)、茶叶(Sunetal.,2019)等经济作物病害识别方面均取得令人满意的效果(Lietal.,2020b;Thaiyalnayaki&Joseph,2021;Thangarajetal.,2021)。
1.3传统机器学习方法在作物病害识别中的应用分析
传统机器学习方法由于其计算效率快、鲁棒性强等优势而广受欢迎,使其在相当长一段时间内成为主流的机器学习方法(Lietal.,2020)。然而随着大规模种植的普及以及作物致病菌传播速度的加快,传统人工提取特征输入分类器的方法逐渐力不从心(Farberetal.,2019),主要问题如下:
(1)数据采集阶段。传统机器学习方法对数据质量要求较高,一般需要人工采集数据,并且对光照和风力等采集环境以及采集设备的要求较高,尤其是采集后的图像需要逐一进行预处理,这就加大了工作强度,在大规模种植环境下人工采集数据的时效性不能得到有效保证,可能会延误病情,错过最佳的防治时期。
(2)特征提取阶段。需要依据人类主观经验选择适宜的特征,人工选择特征需要较强的专业背景和知识储备,主观性强,选择特征数量有限(Singhetal.,2020);一些肉眼无法辨别而对分类有价值的特征容易被忽略。特别是在大规模种植环境下,面对海量的数据,人工选择特征将会极大地限制病害识别进度。
(3)传统机器学习算法对分类器依赖性强,不同分类器识别的病害结果可能差别较大,需要有经验丰富的专业人员选择分类器(Bengioetal.,2013)。另外,分类器泛化程度低,存在同一植株不同环境下的病害识别效果差距较大的问题。
2基于深度学习的作物病害识别方法
深度学习在处理大规模数据方面有较大的优势,它通过不断增加网络深度和迭代次数,从而达到从海量输入数据中自动提取数据特征并进行分类识别的目的(Salasetal.,2019)。本节主要分析深度学习相关技术及在作物病害识别中的研究进展,并对该方法进一步分析。
2.1深度学习技术及算法流程
深度学习理论由卷积神经网络发展而来,故又称为深度卷积神经网络。相对于传统机器学习方法,深度学习具有更多的隐藏层和海量的训练数据,通过调整不同的优化函数和损失函数,模型可以从这些数据中经过不同隐含层进行特征变换来学习更有价值的信息(余凯等,2013)。深度学习解决复杂问题的能力已经被证明,可以实现对数据、计算资源的综合利用,在语音识别、图像处理和自然语言处理等方面取得了突破性的进展(Salasetal.,2019)。
常用的深度学习模型主要有AlexNet(Krizhevskyetal.,2017)、VGG(Simonyan&Zisserman,2014)、ResNet(Heetal.,2016)、Inceptionv3(Szegedyetal,2016a)、Inceptionv4(Szegedyetal.,2016b)和DenseNet(Huangetal.,2017)等,这些深度学习模型在提出初期都获得了巨大成功,目前大多数下游任务中使用的深度学习模型大多基于以上基础模型演变而来。
2.2深度学习技术在作物病害识别中的应用进展
作物病害数据集如AIChallenger(Wuetal.,2017)和PlantVillage(Hughes&Salathé,2015)被公开后,研究人员得以在大规模作物病害数据上训练深度学习模型。深度学习技术凭借其强大的特征表达能力和无需人工提取特征的优点,使其完成大规模多类型病害识别任务成为可能。Tooetal.(2019a)采用PlantVillage数据集的14种作物38种病害图像。
在目前较流行的深度学习模型ResNet50、ResNet101、ResNet152、DenseNet、VGG16和Inceptionv4等上进行训练,通过统一训练和测试,DenseNet的识别准确率最高,为99.75%。公开数据集的广泛应用促生出大量基于公开数据集的深度网络模型架构,如Zhangetal.(2021)提出了残差自校正自注意聚合网络(residualselfcalibrationandselfattentionaggregationnetwork,RCAANet),该网络由残差模块、自校准模块和自注意力模块组成,通过提出反馈自校正方法抑制原始深度特征中的背景噪声,提高了模型的鲁棒性,同时自注意力聚合模块进一步提高了模型识别的准确度,该模型在AIChallenger数据集上取得了非常有意义的成果。
也有研究人员通过自行收集作物病害数据集进行模型训练,如Ferentinos(2018)收集了25种作物58种病害的87848幅图像,设计了一种基于VGG的深度学习模型,在测试集上准确度高达99%。Tooetal.(2019b)通过修剪过滤器来减少不必要的模型参数在保持模型性能的基础上提高了训练效率,再通过微调现有的模型参数达到理想的效果。Ishengomaetal.(2021)利用无人机采集玉米叶片图像,然后通过深度卷积神经网络分析是否被草地贪夜蛾Spodopterafrugiperda为害。
作物病害公开数据集的出现为病害识别提供了有力的数据支撑。但也存在一些问题:一方面,这将会导致大量研究人员热衷于设计更复杂的深度学习模型,将其与已经在该数据集上训练的模型进行比较,越来越多高准确度的识别模型不断被提出;另一方面,提出的模型大都难以在实际环境中得到广泛应用,理论成果难以转化为生产力。其主要原因之一就是设计模型所用的数据集是在实验室环境下采集的,这些数据集一般具有相似的背景、均匀的光照、统一的采集设备和焦距,与真实环境下采集的病害图像数据差异较大。
近年来,研究人员开始意识到真实种植环境下的病害识别问题,国际知名数据挖掘竞赛Kaggle也公开了一些真实环境下作物病害识别相关的题目,以促进真实环境下作物病害识别研究的发展。不少基于真实种植环境的研究成果被提出,如甜菜叶斑病病害识别(Atoumetal.,2016)、稻田环境下水稻病害识别(Nigametal.,2020)及大豆病害识别(Karlekar&Seal,2020)等。
随着研究的进一步深入和移动互联网终端设备的升级换代,涌现出一批基于深度学习和移动终端的作物病害识别系统,该系统部署在移动终端供用户使用。如Temniranratetal.(202)开发了一种基于YOLOv3的真实稻田环境下的病害识别系统;Piconetal.(2019)开发了一个基于手机端的作物病害识别系统;Maheswaranetal.(2021)提出的基于轻量级智能终端的作物病害识别解决方案;刘洋(2021)提出的病害严重程度估计模型等。
值得一提的是,随着移动终端的普及,传统深度学习模型由于其计算量大而无法满足便携终端离线使用的需求,一种解决方法是将移动端获取的作物病害图片传输到计算服务器,计算服务器接收到数据并计算预测结果后,再将结果传输到移动设备终端。受限于手机图片大小和网络传输限制,这种方法往往难以达到良好的体验效果。边缘计算技术(Wangetal.,2020b)由于其计算过程通过本地设备而无需与云端交互这一特点,有效解决了病害识别时间延迟过长的瓶颈,促进了基于移动设备的作物病害识别研究(王冠等,2020;Lietal.,2021)。深度学习技术之所以能够有优于传统机器学习方法的特征表达能力,其必要条件之一是具备海量的训练数据(Guetal.,2018)。
在实际种植环境下的作物病害识别任务中,难以获得数以万计乃至百万计的训练数据,训练数据不足往往会导致模型出现过拟合的问题(Lietal.,2019),影响模型识别效果。迁移学习技术的出现在一定程度上缓解了训练数据不足的问题,该技术主要通过参数微调将在源数据集上训练好的模型作为初始模型应用在目标数据集上进一步训练,以扩展目标数据的先验知识,从源数据集训练好的模型中提取有用的信息,并迁移到目标任务中来(Shaoetal.,2015)。
迁移学习技术提出后在作物病害识别领域得到广泛的应用,如Barbedo(2018)设计了一个基于迁移学习的12种作物病害识别模型,利用迁移学习技术在作物病害识别中取得良好效果;Jiangetal.(2021)以小麦和水稻病害为研究对象,收集了种水稻病害和种小麦病害图像,每种病害40幅,利用在ImageNet上预训练好的VGG模型进行迁移学习并加以微调,识别准确率高达98.75%。此外迁移学习还在番茄等作物病害识别中有着不错的表现,证明了迁移学习技术在基于深度学习的作物病害识别方面的有效性(Chenetal.,2020;Abbasetal.,2021)。
深度学习具有强大的特征表达能力,而传统机器学习算法具备较强的鲁棒性,可以通过某种方法将两者优势结合用于作物病害识别。如Sethyetal.(2020)提出了一种基于ResNet50和SVM相结合的水稻病害识别方法,并对5932幅水稻病害图像进行测试,F1分数为98.38%,高于基于迁移学习的病害识别方法;Jiangetal.(2020)利用CNN模型来提取水稻病害特征,然后将提取到的特征输入到SVM进行分类,通过调整参数,识别准确率高达96.8%。此外,深度学习技术与传统机器学习相结合的方法也在其他作物病害识别中有着较好的表现(Thaiyalnayaki&Joseph,2021)。
3展望
在大规模种植环境下作物病害识别领域,深度学习方法逐渐占据主导地位,涌现出越来越多的基于深度学习的作物病害识别模型,其识别准确率和精度都达到一个新高度。传统的机器学习方法凭借其强大的鲁棒性与高效性在训练数据不足的情况下仍然具有较强的应用价值,与深度学习技术共存将会是未来一段时间内作物病害识别的发展方向。
在实际种植环境下,往往会出现多种病害共存的情况,即一个植株同时出现种或以上的病害,这就需要分类模型同时考虑多种病害的情况,并且分析不同种病害之间的关联性,及时准确地识别多种作物病害并及时干预,保障作物免受病害困扰。目前针对作物病害识别用到的数据集多数具有较明显的病理表型特征,尤其是病害蔓延暴发后的数据较多。在实际种植过程中,及时发现病害发病初期特征至关重要,把作物病害控制在大规模发作之前,这就需要人工智能技术及时预测将要发生的病害种类,以便及时采取措施,这也是未来病害识别需要解决的问题之一。
随着物联网技术、网络技术以及图像采集技术的发展,真实环境下高质量的数据采集将会更加普遍,在未来作物病害识别研究领域,高质量的训练数据将会进一步提升模型的特征表达能力,为理论成果落地铺平道路。未来的作物病害识别将会随着人工智能技术的发展而不断完善,结合集成学习(Liu&Wang,2010)、强化学习(Nguyenetal.,2020)和视觉transformer(Dosovitskiyetal.,2020)等技术的发展,将会有更多的作物病害识别模型落地生根,为农业现代化插上理想的翅膀。
参考文献(References)
AbbasA,JainS,GourM,VankudothuS.2021.TomatoplantdiseasedetectionusingtransferlearningwithCGANsyntheticimages.ComputersandElectronicsinAgriculture,187:106279AhmadLotiNN,MohdNoorMR,ChangSW.2021.
Integratedanalysisofmachinelearninganddeeplearninginchilipestanddiseaseidentification.JournaloftheScienceofFoodandAgriculture,101(9):35823594
AraujoJMM,PeixotoZMA.2019.Anewproposalforautomaticidentificationofmultiplesoybeandiseases.ComputersandElectronicsinAgriculture,167:105060
作者:周长建,2宋佳2向文胜1,2,3*