青海新闻网·大美青海客户端讯 11月12日,中国科学院西北高原生物研究所、青海大学科研人员联合在《Nature》旗下综合性科学期刊《Scientific Data》在线发表科学研究论文,揭示青藏高原旗舰物种、国家一级重点保护动物藏羚高质量的染色体水平基因组信息,这也是我国科研人员首次获得藏羚染色体水平的高质量基因组和注释信息。
藏羚是世居青藏高原的典型反刍动物,分布在海拔3250米至5500米高原地带,属偶蹄目牛科藏羚属野生动物,是藏羚属唯一物种。19世纪中期至20世纪初,猖獗的非法盗猎使藏羚的种群数量下降了约90%,2000年被IUCN(世界自然保护联盟)红色濒危物种名录评估为濒危物种。
经过30多年的保护,藏羚的种群数量恢复到了30多万只。2016年,IUCN对藏羚评级也从濒危降为近危。藏羚不仅是世界上分布海拔最高的反刍动物之一,也是青藏高原唯一具有长距离迁徙行为的物种,是研究高海拔适应性机制和迁徙行为的良好模型。
然而迄今为止,公开数据库中仍缺少藏羚高质量的染色体水平基因组,严重限制了基于遗传特征解析其物种适应、进化及种群生态相关工作的开展。
中国科学院西北高原生物研究所动物生态与资源保护研究团队联合青海大学,基于三种基因组测序技术,成功组装了藏羚染色体级别的基因组。结果显示,藏羚基因组组装的连续性好,完整度和准确性高。科学研究发现,藏羚基因组重复序列主要由SINEs、LINEs、LTRs和DNA transposons四种类型组成,序列总长度为1.65Gb,占基因组的52.47%。
科研人员基于蛋白同源预测、蛋白从头预测和深度学习等多种策略,在藏羚基因组上共注释到28330个功能基因,科研人员通过多种技术手段,首次获得了藏羚染色体水平的高质量基因组和注释信息,为藏羚的适应进化遗传机制、保护遗传学研究及进一步探索物种迁徙行为的遗传机制提供了重要的基因组资源。