白驳风在哪看比较好 http://pf.39.net/bdfyy/bjzkbdfyy/141202/4528359.html

背景导读

  冬青是冬青科的一个单属植物群,它既包含常绿植物又包含落叶,广泛分布在整个亚热带地区。冬青属大约包含有个物种,其中有些物种具有药用价值,它们对治疗流感、缓解疼痛和抗炎有效。有研究提出,从梅叶冬青中提取的Asprellcosides能明显抑制甲型流感病毒的复制,而从小果铁冬青中提取的rotundarpene能抑制TNF-α-介导的通路。

  冬青属植物具有多种药理特性,需要对其进行准确的分类。作者利用基因rbcL和atp-rbcL基因来分析冬青的演化关系将种冬青植物分为美洲类群、亚洲/北美类群、落叶类群和欧亚类群。Manen和同事利用叶绿体标记和5SRNA基因将个冬青物种归类进了4个分支之后,冬青又被进一步细分。最近的研究中又加入了核DNA的ITS序列和nepGS。同时除了常用的DNA区域外,Lin和同事还利用核基因gapC片段研究了冬青的物种形成。中国的冬青可分为多核冬青、冬青和落叶冬青三个亚属,这三个亚属可进一步划分。分类一般以形态学分析为依据,研究中只纳入了一些物种的短的通用DNA标记。

  叶绿体在植物中起着多种作用,如光合作用、氨基酸合成和氮代谢等。由于大多数DNA标记如rbcL、matK和psbA都位于叶绿体基因组中,叶绿体全基因组测序的发展有助于解决植物的系统发育关系。而除了传统的DNA条形码,还可以发现新的DNA标记。

  本研究对19个香港冬青属植物的叶绿体进行测序,获得完整环装叶绿体基因组。进行了变异热点分析、重复序列分析和多态性研究并结合已发表的冬青叶绿体基因组构建系统发育树。

论文ID

《香港冬青叶绿体基因组比较分析和系统发育研究》

 原名:ComparativeanalysisandphylogeneticinvestigationofHongKongIlexchloroplastgenomes

杂志:scientficreport

FI:3.

发表时间:.03

研究结果

利用IlluminaNovaSeq0测序平台对19个冬青属植物叶绿体基因组进行了测序。完整的叶绿体序列通过从头组装的方法进行组装,并通过将原始reads绘制到已拼接的片段中进行验证。通过比较及校正后得到的叶绿体序列被提交到GenBank,随后这19个冬青叶绿体基因组被用来进行indel、SSR和REPuter分析。这其中毛冬青的叶绿体基因组被用作参考基因组(图1)。

图1毛冬青基因图谱

  这些基因组遵循被子植物典型的四部分结构,包含一个大拷贝区(长度范围86,~bp)、一个小拷贝区(18,~18,bp)和一对反向重复区(26,~26,bp)。GC含量范围为37.6%~37.7%,与此前报道的冬青叶绿体基因组一致。所有19种冬青的基因含量和基因顺序均相同。它们包含个基因,其中88是蛋白质编码基因,37tRNA基因和8个rRNA编码基因(表1)。有17基因包含一个或多个内含子,这其中包含12个蛋白质编码基因(ycf3、atpFpetB,petD,ndhA,ndhB,rpoC1,rps12,rps16,rpl2,rpl16,和clpP)以及五个tRNA基因(trnA-UGC,trnI-GAU,trnL-UAA、trnQ-UUGtrnV-UAC)。一部分基因因位于反向重复区而被加倍,其中包含8个蛋白质编码基因(ndhB、rps7rps12,rpl2,rpl23,ycf1,ycf2,和ycf15)、7个tRNA基因(trnA-UGC、trnI-CAUtrnI-GAU,trnL-CAA,trnN-GUU,trnR-ACG,和trnV-GAC)以及4个人RNA基因(rrn4.5,rrn5、rrn16rrn23)(表2)。冬青属叶绿体基因组中发现一个假基因为ycf1。基因组结构和遗传成分的相似性表明,19种冬青叶绿体基因组高度保守。

  表1冬青叶绿体基因组摘要

  表2冬青叶绿体基因组基因功能分类

  重复序列分析。简单序列重复(SSRs)重复的DNA序列范围从1到6个核苷酸。重复序列的数量和位置被认为是群体遗传学研究的重要内容,并被广泛应用于叶绿体基因组多态性的研究中。利用MISA分析工具,对19个冬青不同SSR序列的数量和位置进行了搜寻。所有的冬青都不具有五核苷酸重复序列,而小果铁冬青是唯一具有六核苷酸重复序列的品种。单核苷酸重复序列所占比例最大,数量范围为44-56(图2a)。单核苷酸重复序列大部分为A/T重复序列,只有三花冬青、绿冬青、大埔秤星树、灰冬青和纤花冬青5个物种具有C/G重复序列。A/T重复序列至少占总SSR的75.9%,在陆生植物SSR中已有丰富的报道。除在榕叶冬青和毛冬青中存在的ACAT/ATGT四核苷酸序列外,二、三、四核苷酸序列的数量和类型均较为保守(补充表S2)。从SSR分布来看,大部分SSR分布在大拷贝区和小拷贝区,而在IR区域没有发现,这与被子植物的研究一致(图2b)。由于大拷贝区、反向重复区和小拷贝区长度的变化,还计算了不同区域SSRs的密度。在两个IR区均发现少量SSRs,因此,在这些区域只观察到轻微的变化。简单重复序列在大拷贝区域小拷贝区密度差异较大,分别为枸骨的1.63E?04和三花冬青的4.35E-04。

  图2冬青叶绿体基因组中简单重复序列归类与分布

  图个冬青叶绿体基因组中重复序列的长度和频度

  复合重复区在叶绿体基因组的重组和变异中起着重要作用。利用REPuter对冬青的复杂重复序列进行了分析。重复序列的长度范围为30-66bp,也是在其他被子植物的典型范围内。重复序列的总数量变化并不大,数量范围在19~26之间,但每类重复序列的数量不同。正向重复序列最多,回文重复次之。互补重复序列仅在8个冬青物种中存在,反向重复序列仅在5个冬青物种中存在(图3)。简单重复序列和复合重复片段的变异可作为鉴定这些物种的DNA标记。

  图4整个叶绿体基因组中核苷酸差异值

  物种间叶绿体基因组比较。单核苷酸多态性(SNPs)和DNA插入-缺失突变(indels)分析是发现中草药DNA标记和条形码的重要手段。因此,通过对19个冬青叶绿体基因组进行配对比对,计算出snp和indels的数量。简而言之,首先将19个冬青基因组彼此对齐,然后通过Perl算法确定的多态性位点的数量。通过数量的比较,可以看出冬青属植物可以分为几个组。大多数冬青物种有到个SNPs和60到个indels。SNPs和indels的平均数量分别为和。而在矮冬青、凹页冬青和青茶香中发现的SNPs和indels均少于80个和20个。在广东冬青、黄毛冬青、剑叶冬青、枸骨、灰冬青、大叶冬青以及纤花冬青中也发现SNPs和indels的数量相对较少。在中国植物区系中,假刺齿冬青组、单序冬青组和冬青组这3个群组被提到了,而在我们的系统发育分析中给出了相同的分类。我们通过滑窗分析来确定差异热点位置。结果表明,19种冬青的平均Pi(π)值为0.,叶绿体基因组差异不大。然而,我们仍然发现了4个高度变异的热点(Pi0.01),rps16-trnQ,rpl32-trnL,ndhD-psaC和ycf1(图4)。rps16-trnQ位于大拷贝区,而其他3个位于小拷贝区。反向重复区差异最小,与其他叶绿体基因组特征一致。

  表3物种间单核苷酸多态性与插入缺失分析的比较

  为研究SNPs/indels与Pi值之间的相关性,首先对19个冬青叶绿体基因组的热点序列进行了比对,然后并以大叶冬青为参考比较其snps和indels的数量。四个热点区域都有独特的特征。首先,三花冬青和绿冬青的rps16-trnQ有68bp的差异;我们还在广东冬青、三花冬青、剑叶冬青、黄毛冬青和绿冬青的rps16-trnQ中发现了5个bp缺失。其次,在大叶冬青,榕叶冬青,灰冬青和枸骨的rpl32-trnL中也发现了5bp的缺失。这些物种都是冬青组的物种。然而由于该区域的缺失量较小,因此其差异距离相对与其他热点较低。(3)尽管ndhD-psaC基因间隔区相对较短(约bp),在广东冬青、三花冬青、剑叶冬青、黄毛冬青和绿冬青这些物种中依旧有12个snp位点分别位于该区域。这一点与该分组在rps16-trnQ区域的观察结果也是一致的。第四,大埔秤星树和沙坝冬青的ycf1基因缺失29bp,这可能解释了这两个物种在系统发育树中出人意料的位置。所有的观察结果表明,SNPs/indels在分化距离中起着重要的作用,这可能对区段分类有潜在的帮助。在滑窗分析之后,利用mVISTA在线程序构建了序列识别图。与Yao在以西域青荚叶的叶绿体全基因组作为参照基因组进行比较的研究类似。结果表明,冬青属植物基因组的基因排列和基因含量与青荚叶属植物基因组相似。trnK-rps16-trnQ、ndhF-rpl32-trnL和ycf1这几个差异热点区被确定,其中IR区大多是保守的。另一方面,在序列同一性图中也可以观察到基因排列的分组。与其他冬青基因组相比,矮冬青、青茶香和冠花冬青的rpoB-trnC均发生了截断。ycf4-cemA在大叶冬青,榕叶冬青,灰冬青,纤花冬青以及枸骨类群中也发现了截断。如我们所料,rpoB-trnC和ycf4-cemA基因的缺失可能分别作为微缺冬青系以及冬青系的DNA标记,这与我们在SNP调查和系统发育分析中的发现相似。

  种间遗传分化和种内变异。为了验证这些变异热点的可靠性,对这些地区的种间差异和种内差异进行了比较。简而言之,将所有19个香港冬青的叶绿体基因组进行比对,然后用dnaSP比较热点的种间分化(π)。在种内比较方面,首先从公共资源中检索到已发表的冬青属物种参考基因组。然后将它们与我们相应的冬青叶绿体(MT、MT和MT)进行比对(表3),比较它们的SNPs和indels数量。在四个热点中,ndhD-psaC基因间间隔区种间距离最高。rps16-trnQ和rpl32-trnL的种间距离具有相似性。ycf1的分化度低于预期,也是由于ycf1的上游序列大多是保守的。变异通常只在3端可见,因为3端与小拷贝-反向重复B区连接处重叠。所有热点的差异均高于整个叶绿体基因组的种间距离。此外,与已发表的基因组相比,全质体的种内变异也极低。枰星树与枸骨的胞质中有10个snp。这两种植物也分别有2个和14个indels。大叶冬青细胞质粒中仅发现1个SNP,未发现indel。结果表明,叶绿体基因组在物种内部具有高度的保守性,rps16-trnQ、rpl32-trnL、ndhD-psaC和ycf1这4个热点可用于物种分类研究。

  图个香港冬青叶绿体基因组区域边界比较

  反向重复区的扩张和收缩分析。除了核苷酸差异的观察,我们也分析了19中香港冬青叶绿体基因组各区域边界扩张和收缩情况(图5)。所有冬青属植物物种的基因排列是高度保守的,rps19,rpl2,ycf1,ndhF和trnHLSC位于四个区域的连接处。大部分连接处是稳定的;然而,我们仍然可以按不同的特征将冬青分为四个组(组I-IV)(图5)。ycf1假基因(ycf1ψ)在第一组和第三组中的长度分别为6bp和1bp。第二组冬青的rps19基因位于LSC区,而其他组冬青的rps19基因位于LSC/IR边界。在这三组冬青中rpl2和ndhF的大小也存在差异。第四组冬青具有前三组冬青的特征。另一方面,在第二组和第三组中观察到亚组。如ycf1基因有bp位于大埔秤星树和沙坝冬青的SSC区;相比之下,第二组冬青的其他成员ycf1基因有bp位于SSC区域。广东赤杨和黄毛冬青的IR区未向ndhF基因扩展;相比之下,在第三组的其他成员中观察到40bp的扩张。此外,这两个物种的ndhF基因在SSC区均为bp,而不是bp。

  系统演化分析。为了更准确地分析冬青的系统发育,本研究还使用了NCBI中可用的冬青叶绿体基因组。使用MEGA软件进行模型检验,绘制最大似然系统发育树图(图6)。系统演化与Cuénoud和同事的研究结果一致。总之,三花冬青和绿冬青被归为北美枝系,而毛冬青、尾叶冬青、枰星树和小果铁冬青被归为落叶枝,大叶冬青、榕叶冬青、枸骨以及全缘冬青被划分为欧亚分支。在使用psbA-trnH间隔及其区域的研究中也得到了类似的结果。我们的研究也与《中国植物志》和《中华植物志》的分类一致。如预期的那样,矮冬青、凹叶冬青和青茶香在一组,同时广东冬青、黄毛冬青和剑叶冬青被归为微缺冬青系和聚伞花冬青系列。对凹脉冬青系和点叶冬青系也进行了正确的分类。由于4个变异热点中有3个位于冬青叶绿体基因组的SSC区,因此仅利用SSC序列进行了系统发育研究。正如预期的那样,分类与上面提到的结果相似,尽管一些节点的支持度较低。所有的群组的分布与使用整个叶绿体基因组相似。结果表明,具有3个DNA热点的SSC区域可以为冬青的鉴定和系统发育研究提供足够的信息。

  图6基于完整叶绿体使用最大似然法进行的系统演化树以及基于SSC区域做的系统演化树

讨论

  本文报道了19种香港本地冬青的全基因组。虽然这19种冬青和其他被子植物叶绿体基因组的组织结构高度相似,但在总长度、区域边界和重复序列分布方面存在显著差异(表1;图2、图3、图5)。从纤花冬青的,到广东冬青的,bp,其基因组大小相差近1kb。此前对7个冬青叶绿体基因组的研究发现最多存在bp的差异。因此,在我们的研究中发现更多的变化是出乎意料的。在烟草属和栎属等许多属中,这种现象是由于IR区收缩和扩张造成的。然而,在冬青的IR区仅观察到大约60bp的微小变化。另一方面,在LSC区域观察到很大的差异。纤花冬青和广东冬青分别拥有最短和最长的LSC区,差异为bp。然后我们发现了纤花冬青的trnT-trnL和ycf4-cemA间隔区大量缺失。这两个缺失约为bp。这一发现可能为基因组大小的变化提供了解释。除纤花冬青中的缺失外,灰冬青和枸骨中也存在trnT-trnL缺失,而大叶冬青、榕叶冬青、灰冬青和枸骨中均存在ycf4-cemA缺失。mVISTA分析说明了这些结果(补充图S1)。参考mVISTA的序列分析图,在矮冬青、青茶香和凹叶冬青中发现rpoB-trnC间隔缺失。事实上,在这些区域的缺失已被广泛用于物种鉴定。矮冬青、青茶香和凹页冬青是微缺冬青系的成员。在这些物种中,rpoB-trnC基因间区域的缺失可以作为物种鉴定的分子标记。

  所有的冬青叶绿体基因组在边界区都表现出类似的排列(图5)。总之,在所有的冬青物种中,ycf1中都发现位于SSC/IR边界。因此,假基因ycf1ψ的产生并与ndhF重叠。这种现象也在其他被子植物中发现,如鼠尾草和李子。根据IR扩张的变化,我们可以将研究的冬青分为四个不同的组。第一组和第三组的大部分冬青物种分别属于落叶类群和北美类群。在Cuénoud的研究中,第一组冬青也被归为欧亚分支和中国冬青系。第四组冬青具有第一组、第二组和第三组冬青的特征,这可能解释了我们在系统发育研究中对圆叶冬青的意外分类。除一般分组外,在第二组和第三组中也观察到亚分组(补充表S6)。与第二组冬青其他成员相比,大埔枰星树和沙坝冬青的ycf1的长度差异尤其明显。这一结果可能是这两个物种在我们的系统发育分析中出人意料的位置的原因。另一方面,广东冬青和黄毛冬青的边界排列更为相似,表明这两种冬青的分类学关系可能比第三组冬青的其他成员更密切。结果表明,IR扩张现象和基因组边界特征可为冬青和其他被子植物分类提供有用信息。

  我们的滑窗分析显示,rps16-trnQ、rpl32-trnL、ndhD-psaC和ycf1的变化最大(图4)。然而,传统的条形码区域,如rbcL、matK和trnH-psbA间隔,仅显示较低的Pi值(Pi0.)。这一发现表明,传统的DNA条形码区域无法在较低的分类水平上提供足够的差异。事实上,rps16-trnQ、rpl32-trnL、ndhD-psaC和ycf1也是其他叶绿体基因组中不同的热点。rpl32-trnL间隔序列是一个快速进化的序列,用于区分莴苣和向日葵。rps16-trnQ也被认为是被子植物12个不同属的DNA条形码。ycf1是最有保障的叶绿体DNA条形码,因为它比matK、rbcL和trnH-psbA间隔组合更能区分物种。如上所述,rpoB-trnC、trnT-trnL和ycf4-cemA显著缺失。

  利用完整的叶绿体基因组和SSC区域进行系统发育分析(图6)。除小果铁冬青、沙坝冬青和大埔秤星树外,几乎所有的物种都在相应的切片上得到了正确的分类。有两个差异。首先,根据中国植物志,小果铁冬青应在单序冬青组。然而,在我们的基因组研究中,小果铁冬青已被归为小果冬青组。由于单序冬青组和小果冬青组属于两个不同的亚属,因此可以观察到明显的形态变异。在小果冬青组中发现了一些共同的特征,如小果铁冬青的侧脉的数量和芘的数量。另一方面,根据中国植物志,小果冬青组的叶表面呈膜状。而在我们的小果铁冬青标本中,叶表面呈薄革质。除中国植物志外,本文还对小果铁冬青的系统发育进行了研究。Cuénoud和同事将铁冬青和毛冬青归为同一落叶支系,与铁冬青最接近的物种是小果冬青。有趣的是,小果冬青也是小果冬青组的成员,这与我们的系统发育分析是一致的。综上所述,我们认为铁冬青应该更接近于小果冬青组,而不是单序冬青组。然而,还需要更多的样本来进一步证实这一观察结果。另一个有趣的发现也注意到在沙坝冬青和大埔枰星树,在我们的系统发育分析中,它们被确定为假刺齿冬青组的成员。而中华植物志则将其归为似落叶冬青组的成员,并与枰星树归为一类。这种差异需要通过分析核和线粒体标记进一步解决。

结论

  摘要对19个冬青属植物的叶绿体基因组进行了测序,其中14个基因组为首次报道。对重复序列的变化进行了说明,并发现了四个有差异的热点。这为开发药用冬青的鉴定标记提供了潜在的应用价值。结合已发表的25份冬青叶绿体基因组,对其系统发育关系进行了研究。这项工作为我们更好地了解冬青的系统发育提供了基础。

温馨说明

  1、本文涉及到的所有分析惠通生物均可提供,欢迎联系我们获取小基因组文章专业解决方案,助力文章发表。

  2、惠通生物小基因组服务

欢迎   深圳市惠通生物科技有限公司,成立于年,技术成员在生物信息方面均有五年以上分析经验,在小基因组项目上形成强劲技术优势并可提供定制化高级分析内容。成立至今已服务客户单位余家包括中国科学院植物研究所,中国科学院先进技术研究院,华南农业大学,中国人民解放军疾病预防控制中心等科研单位。合作老师发表小基因组SCI文章逾百篇。

预览时标签不可点收录于话题#个上一篇下一篇


转载请注明地址:http://www.yanzizhanga.com/yzzzz/7949.html