学术咨询

让论文发表更省时、省事、省心

基于深度卷积神经网络的细胞分类新方法

时间:2020年04月22日 分类:科学技术论文 次数:

摘要:针对现有的细胞分类方法在准确率方面无法满足人们要求的现象,本文提出一种基于深度卷积神经网络的细胞分类新方法:嵌套残差网络(MultipleResidualNeuralNetwork,M-ResNet)。该方法以深度学习理论为基础,在原始ResNet50基础上添加了更高级别的快捷连接

  摘要:针对现有的细胞分类方法在准确率方面无法满足人们要求的现象,本文提出一种基于深度卷积神经网络的细胞分类新方法:嵌套残差网络(MultipleResidualNeuralNetwork,M-ResNet)。该方法以深度学习理论为基础,在原始ResNet50基础上添加了更高级别的快捷连接(嵌套快捷连接),以挖掘残差网络的优化能力。实验采取宫颈癌细胞作为数据集进行了细胞分类方法测试,其中3528幅作为训练集,350幅作为测试集。通过与ResNet50网络模型进行对比实验,得出测试结果表明:该方法可以有效提高细胞分类的正确率和工作效率,验证了该方法的有效性。这些研究对卷积神经网络的应用和细胞分类方法的发展有着重要的意义,有很好的现实价值。

  关键词:宫颈细胞;深度学习;卷积神经网络;残差网络;快捷连接

神经网络

  0引言

  在现代医学诊断中,细胞图像分类发挥着重要的作用。通过对细胞图像的分类,可以快速得到细胞的部分状态信息,对病理的诊断和确定有着重要的意义。因此,长期以来医学诊断的发展都是人们关注的重点研究课题。我国对于医学诊断中的细胞分类研究也十分重视。随着新技术的发展和应用,原有的细胞分类方法在分类效率等方面的缺陷逐渐暴露出来。为了推动细胞分类工作的发展,本文拟通过分析细胞分类方法目前存在的问题,研究一种基于深度卷积神经网络的细胞分类新方法M-ResNet。

  1细胞分类与深度卷积神经网络

  细胞图像分类是现代医学诊断中常用的一种技术方法。目前细胞分类方法已经发展的比较成熟,可以满足不同条件下的需求。在应用的过程中,现有的细胞分类方法也存在着一定的不足。

  1.1细胞分类方法现存问题

  细胞学检查法最早应用于早期宫颈癌的排查工作。通过对细胞图像的分析实现对细胞生理信息的判断,可以有效提高早期宫颈癌的排查效率和准确率。但该类方法不仅需要大量专业技术人员,而且工作效率低下[1]。采用计算机辅助细胞学检测的方法不仅可以提高筛选效率,也能够有效降低误诊率和假阴性率[2]。

  经过多年发展,计算机辅助的细胞图像分类方法已经比较成熟。目前应用于细胞分类的方法主要有两种,分别是基于细胞核特征构建的分类方法和多图像裁剪分类方法。但这两种方法的应用都存在一定的局限性。基于细胞核特征构建的分类方法缺乏一定的准确率,而多图像裁剪分类则容易造成信息冗余或丢失等[3-4]。因此,人们需要推动新的细胞分类方法的发展。深度卷积神经网络凭借自身的优势受到了人们的广泛关注。

  1.2卷积神经网络发展现状

  针对原有的细胞分类方法存在的缺陷,人们提出了基于卷积神经网络的细胞分类方法。作为人工神经网络的一种,卷积神经网络(CNN)在降低模型复杂度和权值数量的同时,可以有效保持图像的高度不变形。因此,卷积神经网络在图像识别等领域的应用受到了人们的广泛关注[5-6]。针对传统神经网络存在的向前传输神经元输出值持续增大的问题,Glorot等人提出了Xavier算法初始化CNN[7-8]。但该方法仍未完全克服网络的不稳定性。因此,蔡楠等人提出了一种基于核主成分分析的方法,用于实现初始化CNN的权重[9]。这些方法对于卷积神经网络的结构优化和应用都有很重要的意义。

  1.3基于深度卷积神经网络的细胞分类方法

  近年来,卷积神经网络在细胞分类中广泛应用。实践经验表明:CNN在宫颈癌变的识别中可以发挥出重要的作用。CNN的应用方法比较多样,例如根据多模态数据、细胞图像、阴道镜图像等都可以实现癌变识别的目的[10-12]。在重叠图像的识别方面,CNN也有着独特的应用[13]。为了克服卷积神经网络在图像特征提取方面存在的准确率问题,赵越等人提出了一种将特征提取器和分类器联级为整体的CNN分类器,并验证了其应用效果,明显提升了细胞分类的准确率[14]。

  上述研究都表明CNN可以有效提高细胞分类的效率和质量。现有的基于卷积神经网络的细胞分类方法在复杂背景和含有杂质的细胞分类方向上存在着比较大的局限性。对此,本文以深度学习的理论为基础,根据卷积神经网络的算法特点,提出了一种适用于细胞分类的深度卷积神经网络的算法优化方法,并进行了其在细胞分类中的应用实验。

  2本文算法

  2.1ResNet网络介绍

  CNN提供了一种端到端的深度学习模型,模型中的参数可以通过传统的梯度下降法进行训练,经过训练的卷积神经网络能够学习到图像的特征,并且完成对图像特征的提取和分类。与传统的机器学习算法相比,采用深度学习算法可以免去分割提取特征的繁琐过程,让算法流程变得简单,同时也避免了传统算法中由于预处理、分割、特征提取等操作造成的误差,使得细胞的识别率比传统的机器学习要高。模型的深度在图像分类中发挥着至关重要的作用,这导致ImageNet竞赛的参赛模型都非常深。在追求网络深度的时候,出现了一个新的问题:梯度消失/梯度爆炸。

  后来,通过归一初始化和中间归一化解决了这一问题,使得数十层的网络在反向传播的随机梯度下降上能够收敛。当深层网络能够收敛时,一个退化问题又出现了,ResNet网络通过深度残差框架解决了这个退化问题。ResNet模型的出现是CNN史上一个里程碑事件,ResNet可以训练出更深的CNN模型,从而实现更高的准确度。变化主要体现在ResNet直接使用stride=2的卷积做采样,并且用globalaveragepool层替换了全连接层。为了保持网络层的复杂度,ResNet采用了一个重要的设计原则:当特征图的大小降低一半时,特征图的数量将会增加一倍。ResNet模型的核心是通过建立前面层与后面层之间的“短路连接”(shortcuts,skipconnection),这有助于训练过程中梯度的反向传播,从而训练出更深的CNN网络。

  2.2M-ResNet网络

  尽管ResNet模型使用了“短路连接”来实现特征重用(featurereuse),但是由于短连接的数量比较少,特征重用的作用并没有达到最好的状态,通过简单地堆叠残余块来构建网络不可避免地限制了其优化能力。本文提出了深度卷积神经网络的细胞分类新方法M-ResNet,下面将详细介绍改进细节。M-ResNet整体结构图和ResNet50基本一样,整体结构由5部分构成,分别是:conv1,conv2_x,conv3_x,conv4_x,conv5_x。每部分由指定个数的block组成,总共有16个block,每个block为3层,所以有16×3=48层。开始有一个7×7×64的卷积,最后有一个用于分类的fc层,所以M-ResNet总共有50层。

  相比ResNet,M-ResNet使用了一种比ResNet连接更多的机制,将conv_2x中的前两个block输出的特征图全部叠加到第3个block输出的特征图上作为conv_3x的输入。M-ResNet是将原先的block残差块进行再一次的嵌套快捷连接,叠加的方式是通过元素级的相加。conv_2x中有3个普通快捷连接和2个嵌套快捷连接,共5个快捷连接,conv3_x,conv4_x,conv5_x分别有7,11,5个快捷连接,所以M-ResNet共有28个快捷连接,相比ResNet50的16个快捷连接,多出12个嵌套快捷连接。

  3实验及结果分析

  本文通过分析深度学习的理论,结合卷积神经网络的算法特点,对基于深度卷积神经网络的细胞分类算法进行了优化。为了验证优化后算法MResNet的效果,本文进行了实验分析。实验共分为3部分进行,分别是数据集预处理、网络训练和结果分析。该测试方法也是目前广泛采用的实验测试方法,可以对实验效果进行比较全面的分析。

  3.1数据集

  本文采用的数据集是来自海莱乌科技大学(HerlevUniversityHospital,HUH)和丹麦科技大学(TechnicalUniversityofDenmark,TUD)搜集的Herlev巴氏涂片新版数据集。总共917个单独的巴氏涂片细胞图像,分别为浅表鳞状上皮、中层鳞状上皮、柱状上皮、轻度中度重度非典型增生和原位癌共7类细胞。

  3.2评价指标

  每类细胞选用50张样本进行测试,正确率、召回率和F值是评价网络优劣的重要指标。其定义分别为正确率=正确识别的个体总数识别出的个体总数,(8)召回率=正确识别的个体总数测试集中存在的个体总数,(9)F值=正确率×召回率×2正确率+召回率,(10)其中,识别出的个体总数即为识别出的正确细胞个数加上识别出的判断错误的细胞个数;测试集中存在的个体总数即为本文选取的各类细胞的样本(50张)。正确率是评估识别出的细胞中判断正确的细胞所占的比例;召回率是指召回目标类别的比例;F值是综合前两者的评估指标,用于综合反映整体的指标。

  3.3网络训练

  在完成预处理工作后,本文采用M-ResNet对宫颈细胞数据集进行分类识别。设备要求:①在Window10X64系统上进行;②GeForceGTX1080TiGPU显卡;③内存15G。该实验在TensorFlow框架下进行训练。本文的迭代次数为20000,动量为0。9,学习率为0。0001。为了防止过拟合,提高模型的泛化能力,在模型训练的过程中,将训练集按照5∶1的比例进一步地划分为训练集(trainsamples)和验证集(validationsamples)。在本文中,训练集的数量为2943,验证集的数量为585。本文的M-ResNet模型以宫颈细胞图像及其标签作为输入,通过网络的学习,得到一个模型文件,最后输入测试集,得到带有标签和概率的结果图像。

  3.4结果分析

  完成数据集预处理、训练和测试工作后,本文对所得到的图像数据进行了统一处理,并对基于深度卷积神经网络的细胞分类新方法M-ResNet的应用结果进行了分析。并标注该细胞属于哪种宫颈细胞类型及细胞属于所标类型的概率。所属细胞类型及其概率分别为:(a)normalSuperficiel1。0,(b)Normalintermediate1。0,(c)Normalcolumnar0。99,(d)Lightdysplastic1。0,(e)Moderatedysplastic0。99,(f)Severedysplastic0。99,(g)Carcinomainsitu0。99。

  4结论

  宫颈细胞分类对医学诊断和医学图像处理有着重要的意义。针对现有的细胞分类方法中存在的效率低、正确率偏低等问题,本文以深度学习理论为基础,研究了一种基于深度卷积神经网络的细胞分类新方法M-ResNet,并采用Herlev数据集对该方法进行了测试。测试结果表明:该方法在提高细胞分类正确率和工作效率方面有着明显的作用。但对于中度非典型增生和原位癌的具体识别工作还有待进一步提高,可作为下一步研究的主要工作目标。

  参考文献:

  [1]RustagiAS,KamineniA,WeinmannS,etal。Cervicalscreeningandcervicalcancerdeathamongolderwomen:apopulation-based,case-controlstudy[J]。AmericanJournalofEpidemiology,2014,179(9):1107-1114。[2]NayarR,WilburDC。TheBethesdasystemforreportingcervicalcytology[M]。Heidelberg:SpringerInternationalPublishing,2015。

  [3]PlissitiME,NikouC。Cervicalcellclassification

  basedexclusivelyonnucleusfeatures[C]。Proceedingsofthe9thInternationalConferenceonImageAnalysisandRecognition。Heidelberg:Springer,2012,PartII:483-490。

  [4]ZhaoM,WuAG,SongJJ,etal。Automaticscreeningofcervicalcellsusingblockimageprocessing[J]。BiomedicalEngineeringOnline,2016,15(1):131-151。

  [5]许可。卷积神经网络在图像识别上的应用的研究[D]。杭州:浙江大学,2012。

  图像识别论文范文:试论图像处理技术特征及其在网页制作中的作用

  近些年,随着社会经济的快速发展,基于网络而开展的企业宣传、远程教育、网购等也得到了快速发展。网页制作技术成为网站建设的重心,人们审美能力也得到了提升,对于网页也有了更高的要求。美观的网页界面成为消费者和网站工作者的共同追求,这就对设计师提出了更高的要求,设计师需要借助图形处理技术来对其进行美化。本文就对网页制作过程中图形处理、技术设计等方面进行阐述,以此来说明图像处理技术的优势。