时间:2022年03月19日 分类:农业论文 次数:
摘要:目的基于高通量测序获得药用资源植物密花香薷Elsholtziadensa叶绿体基因组序列,分析了叶绿体基因组结构及特征,为研究密花香薷资源分类及系统进化奠定了基础。方法以密花香薷叶片为材料,利用改良的CTAB法提取DNA;采用二代测序技术IlluminaNovaSeq平台对叶绿体基因组进行测序;以广藿香叶绿体基因组为参考序列,进行序列组装和矫正,得到完整叶绿体基因组序列;利用生物信息学方法分析密花香薷叶绿体基因组特征并进行系统发育分析。结果获得密花香薷完整叶绿体基因组序列全长149095bp,GC含量37.92%,注释到130个基因,其中包括85个蛋白质编码基因,8个rRNA基因和37个tRNA基因;密花香薷叶绿体基因组中共检测到28个散在重复序列,串联重复序列共检测到191个,单核苷酸重复序列最多,共114个;系统发育结果表明,密花香薷和其他唇形科植物聚合在一起形成一个分支结构,紫苏属植物和香薷属植物亲缘关系较近。结论建立了适于香薷属植物叶绿体基因组测序及其特征分析的方法,丰富了唇形科植物遗传资源,为密花香薷分子标记开发及唇形科属种间系统发育分析研究提供了理论基础。
关键词:密花香薷;叶绿体;基因组;分子标记;系统发育
叶绿体是绿色植物特有细胞器,是细胞能量转换和储存的场所,遗传方式以母系为主,所以在植物中具有种的特异性,其自身拥有一套完整的基因组,重组率低,后代遗传稳定[1-2]。叶绿体基因组在被子植物中具有独立的蛋白表达系统,大小介于1.20×105~1.80×105bp,一般为共价闭合的环状结构,其结构由4部分组成:包含2个反向重复区(invertedrepeats,IRs)、大单拷贝区(largesinglecopy,LSC)和小单拷贝区(smallsinglecopy,SSC)4个部分[3]。
叶绿体基因组相比核基因组包含信息量较小,由于进化模式和分布区域的差异,不同类群物种间基因组有时会发生插入/缺失、重复、倒位、重排等多种类型的结构变异和基因丢失现象,但是,从组成结构、基因类型和数目及排列顺序来看,叶绿体基因组较稳定,具有保守性,长度较小,易于测序,而且叶绿体基因组核苷酸进化速率较低,因此在植物不同分类阶段的系统发育分析中具有广发的应用,叶绿体基因组和其CDS基因片段变异分析常被用于分析物种种群遗传结构分化及动态历史发展规律[4-7]。
烟草NicotianatabacumL.[8]和地钱MarchantiapolymorphaL.[9]2个物种叶绿体基因组测序报道,是人类首次获得绿色植物叶绿体基因组序列信息。二代测序技术的不断完善和推广,为植物叶绿体基因组相关研究提供了技术支持,为后续植物资源分类和鉴定、系统发育、谱系地理学、及野生植物资源利用和保护方面的研究提供了有效的途径[10-12]。
密花香薷ElsholtziadensaBenth.在中国西北地区,如陕西、四川、云南、甘肃、青海、西藏等地广泛分布,其外观形态和紫苏接近,所以又称之为野紫苏,属唇形科(Labiatae)香薷属ElsholtziaL.一年生草本植物,生境多样化,农田、林缘、高山、草地边缘、林下、河边、荒地等海拔1800~4200m的范围内均有分布[13-14]。经研究发现,密花香薷全草可入药,具有发汗解暑、行水散湿、温胃调中的功效,且据现代药理研究,香薷类植物挥发油具有广谱抗菌和杀菌作用,并有直接抑制流感病毒的作用[15-16]。密花香薷亦可作为蜜源,养蜂价值极高[17]。所以密花香薷具有重要的药用和经济价值。
目前,有关密花香薷生药学或化学成分提取和分离相关研究较多[16,18-24],蜜腺的解刨学结构研究比较古老[25],但关于密花香薷资源分类、居群分布规律、生理特性,尤其是分子生物学方面的相关研究还无人涉及。本研究以分布在青藏高原的密花香薷为材料,使用二代测序技术获得密花香薷叶绿体全基因组序列信息,利用生物信息学相关软件,分析其叶绿体基因组构成和特征,不仅可丰富唇形科植物遗传信息,也为后续密花香薷资源分类和鉴定、遗传多样性、种群历史动态发展和香薷属植物间的系统发育与亲缘关系研究奠定了基础。
1材料
用于本研究的密花香薷样本,采于青海省共和县青海湖二郎剑景区(N100.4911°,E36.5785°,海拔3194m),采取生长状况良好的幼嫩叶片,液氮冷存,带回青海民族大学于−80℃冷冻保存,用于DNA提取。植物凭证样本保存于青海民族大学生态环境与资源学院(FGE20197201)。
2方法
2.1全基因组DNA提取及测序
经典CTAB法用于样品DNA提取,琼脂糖凝胶电泳判断样本DNA的完整性,微量核酸测定仪(NanoDrop2000)检测其质量和DNA含量。若样品基因组DNA检测结果符合实验要求,对基因组DNA进行片段化处理,用到的方法一般为机械打断法即超声波法,下一步是对片段化DNA进行纯化和末端修复,还需在3′端加A、连接测序接头,对上述处理完的DNA片段需进行片段长度分选,最后进行PCR扩增构建测序文库,对测序完成的文库需进行质量检测,质检合格的文库用IlluminaNovaSeq平台进行测序,测序读长为PE150。
为确保序列组装过程中的准确性,必须对原始获得的rawreads序列进行一系列处理,主要是去除测序时连接的接头以及扩增时的引物序列;筛选出高质量的数据,保证数据质量(质量值Q≤5的碱基数占整个read的50%以上的reads)。通过前期处理和质量控制之后最终获得高质量的cleandata。
使用bowtie2v2.2.4比对南京集思慧远公司自建的叶绿体基因组数据库,将比对上的测序序列当作样品的叶绿体基因组测序序列(cpDNA序列)。组装核心模块采用SPAdesv3.10.1软件组装叶绿体基因组,组装不依赖参考基因组。使用SPAdes软件对上述cleanreads进行基因组拼接,将拼接结果与PogostemoncablinBenth.叶绿体基因组(MF287372.1)进行blast比对,基因组比对参考序列,查看基因组的保守与重排等共线性分析;基因组比对参考序列结构信息,比较两者间的差异。
2.2叶绿体基因组注释和基因分析
使用blastv2.2.25软件比对NCBI数据库的叶绿体基因组cds序列,手工校正后得到叶绿体基因组基因注释结果。使用hmmerv3.1b2软件比对NCBI数据库叶绿体基因组rRNA序列,得到叶绿体基因组的rRNA注释信息。使用aragornv1.2.38软件对叶绿体基因组序列进行tRNA的预测,得到叶绿体基因组tRNA注释信息。最后使用OGDRAW制作叶绿体基因组完整图谱。利用CodonW1.4.2软件对密花香薷叶绿体基因组密码子偏好性(RSCU,relativesynonymouscodonusage)进行分析和统计。
2.3散在重复序列及cpSSR
分析叶绿体基因组中的重复序列根据不同的分布模式分为2种类型即散在重复序列和串联重复序列,散在重复序列多是失活的转座元件,在基因组中呈分散式分布,简单重复序列(simplesequencerepeats,SSR)标记,是一类由几个核苷酸(一般为1~6个)为重复单位组成的长达几十个核苷酸的串联重复序列。使用vmatchv2.3.0软件鉴定散在重复序列。叶绿体基因组中含有不同重复类型的串联重复序列,一般称之为称之为cpSSR。
使用MISAv1.0(MIcroSAtelliteidentificationtool)软件进行cpSSR的分析,参数1-8(单碱基重复8次及以上)、2-5、3-3、4-3、5-3、6-3,2个SSR序列之间的最小距离设置为100bp。
2.4基于叶绿体基因组序列系统进化分析
搜索NCBI数据库,选取已公开的唇形科,不同属植物共18种[虎尾紫苏Perillafrutescensvar.hirtellaMakinoetNemoto(KT220691.1)、柠檬紫苏P.citriodoraNakai(KT220690.1)、P.setoyensisG.Honda(KT220692.1);海州香薷E.splendensNakaiexF.Maekawa(MH700782.1);OcimumtenuiflorumL.(NC043873.1)、罗勒O.basilicumL.(NC035143.1);丹参SalviamiltiorrhizaBge.(JX312195.1)、鼠尾草S.japonicaThunb.(NC035233);夏枯草PrunellavulgarisL.(NC039654.1);掌叶青兰DracocephalumpalmatumC.Y.Wu(NC031874.1);留兰香MenthaspicateL.(NC037247.1)、欧薄荷M.longifoliaL.(NC032054.1)、黄芩ScutellariabaicalensisGeorgi(MF521633.1)、S.insignisNakai(NC028533.1);广霍香P.cablinBenth.(MF287372.1);棉毛水苏StachysbyzantinaC.KochNC029825.1)、林地水苏S.sylvaticaL.(NC029824.1、红花水苏S.coccineaJacq.(NC029823.1),下载其序列,以茄科的黑果枸杞LyciumruthenicumMurr.(NC039651.1)为外类群。
3结果与分析
3.1叶绿体基因组结构基本特征
密花香薷叶绿体基因组经测序,去掉低质量reads后得到cleanreads22864493个片段,Q20为96.91%,GC含量为39.64%[26]。GC含量也可反应叶绿体基因组组成特征,本研究检测到密花香薷叶绿体基因组GC含量37.92%,远低于AT含量(62.08%),说明具有绿色植物叶绿体基因组普遍AT偏向性的特征[26]。
其中IR区序列包含有4个编码rRNA的基因,所以GC含量(43.16%)明显高于LSC区(35.96%)和SSC区(31.92%)[26]。使用SPAdes软件进行基因组片段的拼接,拼接完成的序列与参考序列(accession:MF287372.1)比对,进行组装完成后的质量检控。最终得到密花香薷叶绿体基因组,全长149095bp,其结构与大多数被子植物相同,为环状双链分子,呈典型的四段式结构(图1)。其中,LSC结构区长度为81497bp,SSC结构区长度为17364bp,2个反向互补重复区IR分别长25117bp[26]。
3.2基因注释及归类分析
密花香薷叶绿体基因组共检测到129个基因,其中包括84个蛋白质编码基因,8个rRNA基因和37个tRNA基因。其中有17个基因在IRs区重复,包含6个蛋白编码基因(ndhB、rpl2、rpl23、rps12、rps7、ycf2),4个rRNAs基因(rrn16、rrn23、rrn4.5、rrn5)7个tRNA基因(trnA-UGC、trnI-CAU、trnI-GAU、trnL-CAA、trnN-GUU、trnR-ACG、trnV-GAC);SSC区包括12个蛋白编码基因,1个tRNA基因;LSC区包含60个蛋白编码基因,22个tRNA基因。
密花香薷叶绿体基因组中大多数蛋白质编码基因由1个外显子组成,共有15个基因(atpF、ndhA、ndhB、petB、petD、rpl2、rpl16、rpoC1、trnA-UGC、trnG-UCC、trnH-GUG、trnI-GAU、trnK-UUU、trnL-UAA、trnV-UAC)包含1个内含子,3个基因(rps12、clpP、ycf3)包含2个内含子。编码基因根据其产物功能的不同分为以下几种类型:(1)光合作用相关基因;(2)自身翻译相关基因;(3)其他基因;(4)未知功能相关基因。
3.3叶绿体基因组密码子偏好性分析
对密花香薷叶绿体密码子研究发现,共检测到26160个密码子,其中编码亮氨酸(Leu)的密码子数量最多,有3397个,占总密码子数的12.99%;编码半胱氨酸Cys的最少,有299个,占总密码子数的1.15%。相对同义密码子(relativesynonymouscodonusage,RSCU)使用度最高的为AUG(2.9901),最低的是CUG/GUG(0.0048)。32个密码子RSCU值大于1.00,其中,29个密码子碱基构成以A或U结尾,其余4个以G或C结尾。
3.4叶绿体基因组重复序列分析
28个散在重复序列在密花香薷叶绿体基因组中被检测到。串联重复序列共检测到191个,单核苷酸重复序列最多,共114个,主要以A(51)和T(56)碱基重复为主,单核苷酸T重复序列最长,为14bp,单核苷酸串联重复序列长度占总序列长度的0.6855%,3碱基串联重复序列总数为55个,2碱基重复序列和4碱基重复序列最少为5个,复合型重复序列12个,串联重复序列长度介于8~26bp,串联序列总长度为1885bp,占叶绿体基因组序列总长度的1.2643%。
基因编码区包含的SSR序列位点总数达84个和分布于基因间隔区(IGS)的SSR序列位点数相同,位于内含子区域(Intron)的为21个,其余2个分布于间隔区和基因编码区。密花香薷SSRs位点在叶绿体基因组中分布不均匀,多态性较高,为后续SSR分子标记的开发提供了理论依据。
3.5基于叶绿体基因组的密花香薷系统发育分析
总共选取了唇形科10个属,共18种植物叶绿体全基因组序列(括号内为物种数目),紫苏属(3)、香薷属(1)、罗勒属(2)、鼠尾草属(2)、夏枯草属(1)、青兰属(1)、薄荷属(2)、黄芩属(2)、刺蕊草属(1)、水苏属(3),外类群1个,加上本研究所测密花香薷叶绿体基因组共20个种,构建了NJ系统发育树。系统发育树结果显示,“密花香薷”与其他唇形科植物聚在一起形成一个大的分支。
19种唇形科植物形成2个大亚支,且分支支持率高(BP=100),第I大亚支(BP=100)由2个分支构成,其中一个分支包含2个亚支,一个亚支由2个分支构成,紫苏属3个物种形成一个单独分支联合海州香薷和密花香薷形成1个分支,另一 分支由罗勒属2个物种单独构成;另一亚支由鼠尾草属2个物种单独形成的一个分支和夏枯草属、青兰属和薄荷属6个物种形成的另一分支构成。第II大亚支(BP=100)由黄芩属2个物种单独形成的一个分支和刺蕊草属1个物种、水苏属3个物种联合形成的另一姐妹分支构成。除密花香薷和海洲香薷Elsholtziasplendens外,同属物种均汇聚在一起形成姐妹分支。
4讨论
被子植物质体DNA通常为母系遗传,因其在进化过程中不经历基因重组,通过对其序列结构组成,特征及变异分析,可以很好地揭示物种系统发育过程[27]。尤其二代高通量测序技术的不断优化,极大地提高了测序效率,降低了测序费用,使植物叶绿体基因组测序在许多物种遗传研究中被频繁使用。
有报道研究表明,叶绿体基因组结构为双链环状DNA分子结构,由4部分构成,包含LSC、SSC和2个IR,其中2个IR区序列相同,方向相反[8]。测序获得的基因组长度介于1.20×105~1.80×105bp,检测到的编码基因数为100~130,蛋白编码基因数最多为70~80,30~32种不同类型的tRNA编码基因被检测到,rRNA编码基因数比较稳定,通常有4种[28]。
本研究所获得密花香薷叶绿体基因组大小和结构与上述被子植物研究结果相符。香薷属植物约有40余种,我国分布有33种,但是有关本属叶绿体基因组测序的报道较少,目前只有2个物种被报道,一个是海州香薷,另一个是本研究所测得密花香薷,比较两个物种叶绿体基因组组成和特征发现,各个区段组成及GC含量差异不大。密花香薷基因组GC含量为37.92%,海州香薷为37.8%[29],叶绿体基因组的总体进化速度较慢,在同属内植物表现出保守性。对测得的叶绿体基因组进行了基因功能注释,共注释到130个基因,检测到了84个蛋白编码基因,其中有4种rRNA基因被检测到。密花香薷tRNAs基因数(37)与海州香薷(38)仅相差1个。
前人研究表明,不同植物所检测到的tRNAs基因数变异较大,同一科内其tRNA基因数目存在较大差异,如壳斗科(Fagacea)植物叶绿体基因tRNA基因数目介于29~46[4],五加科(Araliaceae)植物叶绿体基因组tRNA基因数目介于29~38[30],但rRNA基因数目比较保守,如裸子植物臭柏JuniperussabinaAnt.[5]、惠水金橘CitruserythrosaHort.exTan.[31]、盐桦BetulahalophilaChingexP.C.Li[32]、壳斗科(Fagacea)植物[4]等rRNA基因数目和类型相同,均为为4种(rrn4.5、rrn5、rrn16、rrn23),分布在IRs区,先前报道的海州香薷和本研究检测到的密花香薷rRNA基因数目和类型与上述研究相同。叶绿体基因组差异主要是由反向重复区的变异引起的,而IR在稳定叶绿体基因组结构和影响叶绿体基因组大小方面起着非常重要的作用[5]。
位于IRs的ycf1、ycf15、ycf68基因编码区内有终止密码子,所以被称为假基因[33],这几个假基因在不同种之间表现出广泛的变异性,密花香薷和海州香薷主要差异也分布在IRs区,本研究密花香薷未检测到ycf15、ycf682个基因,但在海州香薷中被检测到。密花香薷基因分布和很多被子植物研究结果一致,编码基因主要分布在LSC区,大多数的基因只含有一个外显子,单拷贝基因居多,17个基因在IRs区重复。
编码蛋白和其他被子植物一样,根据其功能主要分为3类,(1)光合作用相关基因;(2)自身翻译相关基因;(3)其他基因;(4)未知功能相关基因[34]。唇形科(Lamiaceae)全球分布有245属7500余种,被认为是被子植物的第6大科,其中包含许多常见的芳香族植物和药用植物,具有巨大的经济价值。叶绿体基因组因具有较强的稳定性和保守性,所以常被用于系统发育树的构建。
Li等[35]基于叶绿体基因组对Harley等2004年提出的唇形科的分类进行了纠正,但是唇形科内部的许多种属系统进化关系还需进一步得到解决。目前有关唇形科植物叶绿体全基因组测序报道较少,相关科及亚科内部系统进化关系构建主要利用叶绿体基因组内部的个别功能基因如Matk、rbcl、ndhF。
本研究以已测得的密花香薷叶绿体基因组联合NCBI下载的18种唇形科植物叶绿体基因组序列构建了NJ进化树,结果表明,该进化树的分辨率较高,各节点也获得了较高的支持率,唇形科内属间呈现出较为明确的发育关系,同一属内物种呈明显的姐妹关系。
本研究所下载的18个物种序列中,除罗勒属2个物种为罗勒亚科(Ocimoideae)外,其余均为野芝麻亚科(Lamioideae),进化树上并没有将2个亚科明显区分,罗勒属2个物种和紫苏属及香薷属聚合形成一个分支,表现出较近的亲缘关系,但分支支持率较低(BP=75)。
沈立群[36]对唇形科药用植物叶绿体基因组进行系统进化分析时发现,罗勒OcimumbasilicumL.和PerillasetoyensisL.(紫苏属植物)两者之间呈姐妹关系,ML分析及MP分析给出的支持率均不高(LB=75,PB=75),这一结论与本研究相同。香薷属和紫苏属2个物种表现出较近的亲缘关系,这一结果和已报道海州香薷叶绿体基因组系统进化关系分析一致。海州香薷和密花香薷虽为同一属物种,但并未形成姐妹分支,可能是2个种形态和分布差异较大的原因。
本研究首次对密花香薷叶绿体基因组进行测序组装,并对其基因结构、密码子偏好性、SSRs数量及分布和基因功能等进行了分析,结合已公布的唇形科物种叶绿体基因组序列,构建了系统发育树,阐明了密花香薷和唇形科内不同属物种之间的系统发育关系,不仅丰富了唇形科植物的遗传资源,也为从分子水平进行植物分类和深入了解植物进化和系统发育提供了有效的途径,这对于密花香薷植物的分类和开发研究提供了理论依据。
参考文献
[1]DouglasSE.Plastidevolution:Origins,diversity,trends[J].CurrOpinGenetDev,1998,8(6):655-661.
[2]BirkyCWJr.Uniparentalinheritanceofmitochondrialandchloroplastgenes:Mechanismsandevolution[J].ProcNatlAcadSciUSA,1995,92(25):11331-11338.
[3]蒋达和.叶绿体基因组的结构研究进展[J].生物化学与生物物理进展,1990,17(1):10-14.
[4]张妍彤,黄剑,宋菊,等.壳斗科植物叶绿体基因组结构及变异分析[J].植物研究,2018,38(5):757-765.
[5]路东晔,张磊,郝蕾,等.臭柏叶绿体基因组结构与系统进化分析[J].西北植物学报,2018,38(8):1464-1475.
[6]NockCJ,WatersDL,EdwardsMA,etal.ChloroplastgenomesequencesfromtotalDNAforplantidentification[J].PlantBiotechnolJ,2011,9(3):328-333.
[7]王玲,董文攀,周世良.被子植物叶绿体基因组的结构变异研究进展[J].西北植物学报,2012,32(6):1282-1288.
作者:富贵1,2,3,刘晶1,李军乔1,2,3*