时间:2021年07月30日 分类:农业论文 次数:
摘要为全面了解白桦类甜蛋白(thaumatin-likeprotein,TLP)基因家族成员的结构、功能和表达特性,本研究采用同源序列比对法,从白桦基因组数据库中筛选并鉴定到41个类甜蛋白基因家族成员,分别命名为BpTLP1~BpTLP41,对其进行生物信息学分析,并通过半定量对白桦TLP家族成员的组织表达特异性进行了分析。结果表明,41个白桦类甜蛋白家族成员分别定位在11条染色体上,其中8号染色体分布最多,包括14个家族成员。该家族成员的氨基酸数量在336~975aa之间,分子量在28054.11~81966.03kDa之间,理论等电点在5.01~5.21之间,偏酸性。基因半定量结果表明,41个白桦TLP家族成员在根、茎、叶中均有不同程度的表达,其中,BpTLP35、BpTLP39在叶片中表达量较高,BpTLP14、BpTLP35、BpTLP36在茎中表达量较高,BpTLP41、BpTLP3在根中表达量较高。
关键词白桦;类甜蛋白;生物信息学;组织表达
植物在生长过程中会受到多种不良外界环境的影响,在长期的进化过程中,植物形成了多种防御机制来响应不良环境的胁迫。当植物受到病原菌的侵害时,会合成木质素(Staskawiczetal.,1995)、植保素(Stevensonetal.,1997)、酚类物质(ReimersandLeach,1991;周洁等,1997)、防御酶系(郭泽建和李德葆,2000;黄秀丽,2009)及抗病蛋白质等物质来提高自身的抗病性。
生物信息工程评职知识:sci收录的遗传学与生物信息学领域期刊
病程相关蛋白(pathogenesisrelatedprotein,PR)是植物受病原菌侵染或一些特定化合物刺激后产生的蛋白质,与系统获得性抗性(systemicacquiredresistance,SAR)和过敏性坏死反应(hypersensitiveresponse,HR)密切相关,是防卫反应基因编码的主要产物之一,不同植物中均有该类蛋白的存在(张青等,2018)。以氨基酸序列的同源性及结构特点为准,可将PR蛋白分为17个家族(王晶等,2011),其中第5家族(PR5)是一类可溶性强、具有抗真菌活性的蛋白,主要包括类甜蛋白(thaumatin-likeprotein,TLP)、渗调蛋白(osmotin)和渗透蛋白(permeatins)(Dafoeetal.,2010)。类甜蛋白在植物防御反应中具有重要作用,与甜蛋白氨基酸同源性较高,但因其无甜味,但具有抗真菌活性,故被称为类甜蛋白(vanderWelandLoeve,1972)。
TLP对不同类型的病原菌生长均有抑制作用,它能与病原菌细胞膜结合,形成离子通道,进而改变膜的通透性,致使病原菌死亡(冯超,2011)。其抗真菌活性的应用如下,过度表达能够诱导不同转基因植物的抗真菌活性,如在过度表达烟草TLP基因的转基因马铃薯植株中发现其抗真菌活性增强(韩德平,2013;Zhangetal.,2018)。
TLP由3个结构域组成,包括域Ⅰ、域Ⅱ和域Ⅲ。大多数TLP含有16个半胱氨酸残基,能够形成8个二硫键,分布在TLP的3个结构域中,同时在域I和域II之间观察到一个域间的分裂。TLP的高酸性结构域间裂缝与其抗真菌和β-葡聚糖酶活性密切相关(Zhangetal.,2018)。β-1,3-葡聚糖是真菌细胞壁的主要成分,葡聚糖酶活性使TLP有效参与病、虫诱导的植物防御反应过程,并在果实成熟过程中发挥着重要作用(El-kereamyetal.,2011;Hoetal.,2007;Yanetal.,2017)。TLP属于多基因家族,目前已从拟南芥和水稻基因组的表达序列标签数据库中分别得到TLP基因家族成员28个和31个(Liuetal.,2010a;2010b)。本研究采用同源序列比对法,从白桦基因组数据库中筛选并鉴定到41个TLP基因家族成员,在基因的染色体定位、蛋白质的理化性质、亚细胞定位、保守结构域等方面进行了预测和分析,并对各家族成员的组织表达特异性进行了分析,为进一步研究白桦TLP基因家族的功能提供参考。
1结果与分析
1.1白桦TLP基因家族成员的筛选和鉴定从白桦基因组数据库中查找TLP家族成员序列信息,通过同源比对及保守结构域分析,最终鉴定出41个白桦TLP基因家族成员,按照所在染色体位置分别命名为BpTLP1~BpTLP41。染色体定位结果表明,41个白桦TLP家族成员分布在11条染色体上,其中以8号染色体最多,分布有14个基因;其次为14号染色体,分布有8个基因。在10、11、12号染色体未发现有白桦TLP基因家族成员分布。
1.2白桦TLP基因家族成员理化性质分析使用ExPASy在线工具ProtParamtool对白桦TLP家族成员进行理化性质分析,结果表明,白桦TLP家族成员的氨基酸数量在336~975aa之间,分子量在28054.11~81966.03kDa之间,理论等电点在5.01~5.21之间,偏酸性。亲水性总平均值显示该家族基因编码蛋白均为疏水性蛋白。亚细胞定位结果表明,BpTLP34~BpTLP40定位于液泡中,BpTLP5同时定位在细胞质和细胞壁中,BpTLP12同时定位在细胞壁和细胞核中,其余家族成员均定位于细胞质中。
1.3白桦TLP基因家族成员蛋白结构分析使用NCBI中的CDD比对分析,该基因家族成员均含有TLP-PA结构域(图2),具有此结构域的基因多参与宿主防御真菌等反应过程(陈建梅,2015)。使用TBtools软件分析保守结构域,结果显示,所有白桦TLP均含有1~4个Motif。除BpTLP12外,均含有Motif1,除BpTLP5、BpTLP6、BpTLP12、BpTLP13、BpTLP14、BpTLP21以及BpTLP28外,其余都含有Motif2,除BpTLP5、BpTLP6、BpTLP12和BpTLP25外,其余均含有Motif3。除BpTLP5、BpTLP6、BpTLP7、BpTLP17、BpTLP28、BpTLP34、BpTLP35、BpTLP36、BpTLP37、BpTLP38、BpTLP39和BpTLP40外,其余均含有Motif4。以BpTLP1蛋白构型模式图为例可见,Motif1、Motif2和Motif3均在“V”字型裂缝中,该特征在类甜蛋白中是高度保守的,保证了蛋白催化功能的实现(刘潮等,2017)。
1.4白桦TLP基因家族成员启动子顺式作用元件分析取白桦TLP家族基因ATG上游1500bp区段进行启动子顺式作用元件的分析,结果表明,该家族基因启动子除含有多个真核启动子核心序列,如TATA-box、CAAT-box外,还含有多个激素响应元件,如脱落酸(ABRE)、茉莉酸(CGTCA-motif)、水杨酸(TCA-element)响应元件、参与低温反应(LTR)、防御和胁迫响应(TC-richrepeats)、受伤和真菌激发响应(Wbox)等元件。其中,29个白桦TLP基因家族成员含有脱落酸响应原件,数量从1-8个不等;18个成员含有茉莉酸响应元件,数量从1-4个不等;而水杨酸响应元件只分布在9个家族成员中;所有基因启动子区均含有多个TATA-box和CAAT-box;10个家庭成员含有参与低温反应响应元件;14个家族成员含有防御和胁迫响应元件;18个白桦TLP基因家族成员含有受伤和真菌激发响应元件。
1.5白桦TLP基因家族成员系统进化分析为进一步了解白桦TLP基因家族成员的功能及其与模式植物拟南芥同源基因间的进化关系,选取了10个不同分组的拟南芥TLP基因家族成员与白桦41个白桦TLP基因家族成员共同构建系统进化树(图5)。结果表明,白桦TLP基因家族成员分组与拟南芥不同,未能分成10个聚类组。其中,BpTLP34~BpTLP41与拟南芥AT4G11650亲缘关系较近,而拟南芥AT4G11650与病原或环境胁迫响应密切相关(刘潮等,2018),推测BpTLP34~BpTLP41基因可能具有相似功能。
2讨论
本研究通过生物信息学的方法筛选和鉴定得到41个白桦TLP基因家族成员,家族成员数量较多。不同植物基因组所含有的TLP基因家族成员数量差异较大,如拟南芥中含有28个TLP基因家族成员、水稻中含有31个、桃(Prunuspersica)38个、杨树(Populustrichocarpa)59个、玉米(Zeamays)67个、面包小麦(Triticumaestivum)84个、火炬松(Pinustaeda)87个。
植物TLP家族成员在细胞中的分布较为广泛,在香蕉(Musaspp.)中,大部分TLP家族成员分布在胞外,少部分分布在液泡中;在莜麦(nakedoats)中,有66.7%定位在胞外,22.2%定位在液泡中(韩德平,2013)。白桦TLP亚细胞定位显示大部分家族成员定位在细胞质,少部分定位在液泡,与前人研究有较大差异,因此推断白桦TLP可能主要在细胞质发挥作用。在桑树中发现所有其所有TLP序列均含有thaumatin结构域(Pfam:PF00314),在杨树(Populustrichocarpa)的59个TLP基因中,其中有49个TLP含有此结构域(Petreetal.,2011),白桦TLP基因家族中均含有此保守结构域,此结构域逐渐成为TLP基因筛选与鉴定的依据(孙伟博,2018)。
在白桦TLP家族成员氨基酸保守基序的分析中发现,白桦TLP家族成员共含有4个保守基序,分别为motif1、motif2、motif3、motif4,22个家族成员含有全部4个保守基序,并且motif1、motif2、motif3保守基序均在由域Ⅰ、域Ⅱ、域Ⅲ构成的“V”字型裂缝中,此结果与刘潮等(2017)人研究一致,该裂缝中含有酸性氨基酸,使其呈酸性,具有高酸性“V”字型裂缝特征的此家族蛋白具有抗真菌活性(韩德平,2013)。染色体定位发现,多个基因具有集中分布的现象,说明这些基因可能是在基因复制过程中进化而来。
在11个染色体上,以8号染色体的TLP基因家族成员数量最多,此基因家族成员在染色体上聚集分布的现象与刘潮(2017)、张华崇等(2019)TLP基因染色体定位结果一致,推测此基因家族扩增的主要方式是复制,组织特异性分析发现虽然各部位表达量不同,此研究与前人研究结果一致,但是在白桦中,与根、茎相比,表达量最高的家族成员在叶片中,此结果与前人研究差异性较大(Masakietal.,2014)。对基因启动子区顺式作用元件分析发现,家族成员含多个生物与非生物响应元件,但是不同的家族成员所含顺式作用元件的类型及数量均不相同,与谷子中类甜蛋白结果的复杂性相符(刘潮,2018),说明白桦TLP基因家族成员参与植物多种生命进程。本研究为探究白桦TLP基因家族功能提供参考。
3材料与方法
3.1材料白桦植株为本实验室培养,培养条件为28℃、光照/黑暗为16h/8h,光照强度1500lx。将正常生长的白桦植株的根、茎和功能叶片分别取下后迅速放于液氮中速冻,-80℃保存备用。3.2白桦TLP基因家族成员的鉴定使用CoGe(https://genomevolution.org/coge/)在白桦物种中搜索TLP基因序列,将全部序列下载下来后,放入NCBI(https://www.ncbi.nlm.nih.gov/)中进行同源性比对及保守结构域分析,将其中同源性比对较高且含有TLP-PA结构域的序列筛选出来,剔除冗余序列。
3.2白桦LP基因家族成员的生物信息学分析使用COGE数据库获取白桦TLP家族基因ATG上游1500bp序列,并通过PLantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)对基因启动子区顺式作用元件进行分析;前人将拟南芥TLP基因家族成员根据功能不同分为10个聚类组(JiaandXiao,2010),在NCBI中搜索并下载拟南芥TLP基因家族成员序列(AT4G38660、AT1G75800、AT5G24620、AT1G19320、AT4G11650、AT1G77700、AT2G27890、AT5G40020、AT1G73620、AT5G02140),采用邻接法(Neighbor-Joining,NJ)构建系统发育树;其它分析工具及网络地址。
作者:毕德泷宁小萌孙晶晶冯思雨李然红*