关键词:
萤叶甲亚科
跳甲亚科
低覆盖度基因组
线粒体基因组
单拷贝直系同源基因
系统发育分析
摘要:
萤叶甲亚科(Galerucinae)和跳甲亚科(Alticinae)均隶属于鞘翅目(Coleoptera),叶甲科(Chrysomelidae),其成虫和幼虫均为植食性,且部分种类为农林牧等产业的重要害虫,具有重要的经济学和生态学意义。在叶甲科各亚科中,萤叶甲和跳甲两个类群的关系最密切,但两个类群的系统发育关系在很大程度上并未解决,跳甲类群是否为独立的亚科一直以来是叶甲科分类学家们关注的重点。萤叶甲亚科族级分类系统及其系统发育关系相对明确,然而其最大的族—根萤叶甲族(Luperini)的单系性及其内部“组(section)”的划分目前还存在争议;跳甲亚科目前尚无被大家认可的族级分类体系,仅以“组”划分,但是“组”内属的组成也存有争议。另外,这两个类群之间的“问题属”的系统地位也需要从不同维度进行探究。
本论文在前人研究的基础上(萤叶甲亚科主要依据聂瑞娥提出的8族分类体系,跳甲亚科主要依据葛德燕的18“组”的分类体系),以萤叶甲亚科和跳甲亚科代表性类群,特别是“问题属”相关类群为研究对象,利用二代基因组测序技术测定其低覆盖度基因组,从中获取2种数据类型(一是线粒体基因组数据,二是单拷贝直系同源基因),基于这2种数据类型,采用不同的建树策略重建这2个亚科的系统发育关系,以探讨它们的单系性及“问题属”的归属、族或“组”阶元的系统关系等问题。本研究的样本包括97个物种,内群包括2亚科共92个物种(萤叶甲亚科8族31属46种,跳甲亚科13“组”27属35种,“问题属”8属11种),外群为叶甲亚科共4属5种。主要研究结果如下:
(1)本研究通过二代测序技术成功获得97个物种的低覆盖度基因组,其中93个为新测得,另外4个种类为Genbank上下载获得。基于覆盖基因组数据共获得两种数据类型:
a.线粒体基因组数据,基于97个低覆盖度基因组数据成果共获得94个物种的线粒体基因组,长度为12~18Kb。所有线粒体基因组均包含37个基因:13个蛋白编码基因(protein coding gene,PCG),2个核糖体RNA(r RNA)、22个转运RNA(t RNA)和1个AT富集区(AT-rich region)或控制区(control region)。这些基因的排列顺序、方向与已测的大部分鞘翅目昆虫一致,无重排现象,且基因之间的排列非常紧凑。除ND1外,其余蛋白编码基因均以ATN(ATT、ATG、ATC)作为起始密码子,以TAA、TAG或单独的T碱基作为终止密码子。13 PCGs的同义替换位点替换次数(Ka)与同义替换位点替换次数(Ks)的比值(Ka/Ks)显示了所有蛋白编码基因均处于纯化选择状态,其演化速率依次为:ATP8>ND4L>ND4>ND2>ND6>ND5>ND3>ND1>ATP6>COIII>CYTB>COII>COI。本文对13个蛋白编码序列的密码子的3个位点及13PCGs进行了碱基替代饱和度分析,结果表明13个蛋白编码基因的3个位点都是不饱和的,在建树的过程中不需要去除任何一位密码子。
b.单拷贝直系同源基因,基于97个物种的低覆盖度基因组,以内翅亚目为参考库,采用隐马尔可夫模型(Hidden Markov Model,HMM)获取单拷贝直系同源基因(提取率阈值设定为40%,高于40%可用于建树,否则舍去),在此阈值下共获得77个物种的单拷贝直系同源基因,之后去除掉简约信息位点低于100 bp以下的序列,以其覆盖度为70%的单拷贝直系同源基因的不同数据类型(核苷酸和氨基酸)进行系统发育树的分析。去除掉简约信息位点低于100bp以下的序列,最终,获得包含215个单拷贝直系同源基因(长度介于104 bp至1,643 bp之间)的氨基酸序列以及346个单拷贝直系同源基因(其长度介于206 bp至1,100 bp之间)的核苷酸序列。
(2)萤叶甲亚科和跳甲亚科二类群的系统发育关系及其高级阶元系统关系的探究。基于线粒体基因与单拷贝直系同源基因2种数据类型,利用IQTree和Fast Tree建树软件,重建了萤叶甲亚科和跳甲亚科的系统发育关系。两种数据集和不同的建树方法生成的系统树的拓扑结构不完全一致,但是其亚科级别、族级和组级的属、种组成及系统发生关系大体一致。所有系统树都支持萤叶甲亚科和跳甲亚科各为单系群,且为姊妹群关系,其中“问题属”Hespera、Luperomorpha、Nonarthra和Stenoluperus镶嵌在萤叶甲亚科进化枝中,Hespera和Stenoluperus为姊妹群,Nonarthra聚类在Hylaspini族里,Luperomorpha位置不太稳定,“问题属”Clitea、Phygasia、Laotzeus和Trachyaphthona聚类在跳甲亚科中,其中Clitea位置相对稳定。萤叶甲亚科族级