“炎黄一号” 测序数据质量世界第一

医疗器械 来源:果壳网
2015
05/29
17:00
果壳网 医疗器械


2015年5月25日,《自然-生物技术》发表了来自华大基因的“炎黄一号”单倍型组装结果。

2008年,“炎黄一号”一诞生即成为“亚洲第一”——第一个蒙古人种的全基因组测序结果。经过科学家的不懈打磨,到《自然-生物技术》这篇最新论文发表的那一刻,从测序数据质量上来说,“炎黄一号”终于成了“世界第一”!

作为和这项研究有些渊源的基因组学工作者,笔者将尽我所能,解读“炎黄一号”基因组的系列科研和技术进展。以期让大家理解,个人全基因组测序现在究竟进展到了什么地步?这项工作的意义和价值又在哪里?

基因组数据:能用,但还不够好

在这个“千元基因组时代”,个人基因组测序似乎已成了大众消费品。那么,为什么世界顶级的基因组研究机构和测序仪生产商,还在不断的测序更多的个人基因组,还要将个人基因组研究做到目前技术条件下“极致精美”的程度呢?

简单的答案就是,因为目前的基因组数据还不够好,因而也不够好用。

我们研究人类基因组最关心的问题,就是将染色体上所有的基因序列都测序出来,并且定位清楚,简单的说,目标就是将人类基因组从第一个碱基开始,一直到最后一个碱基结束,真正完整的呈现出来。

在基因组研究领域,人们对数据的可信度有一个基本的要求:单个碱基越准确越好,对单个碱基的覆盖深度越多倍越好,对整个基因组测得越完整越好,测序的“缺口”越少越好。

以这些标准看,目前的基因组测序结果,还没有一个是完美的。

人类基因组计划:曾经的“最好”

自从“人类基因组计划”和科学狂人克雷格· 文特尔(Craig Venter)先后公布人类基因组图谱以来,基因组研究进入了全新的纪元。然而,这份图谱只是张“不够完美的参考图”,科学家们很快认识到,我们需要更多人的基因组, 才能真正将遗传与基因组信息应用到健康和临床领域。

但是因为测序基因组太过昂贵,科学家们选择了折衷的思路,那就是后来启动的国际人类基因组单体型图计划( HapMap Project),旨在了解人类遗传的单倍型和单点突变。虽然取得了一定的进展,但是根本问题仍然存在——测序的人类基因组数据太少,质量还不够好。

再后来,454公司测序了诺奖得主詹姆斯·沃森(James Watson)的基因组,并将其公布,但是沃森的基因组从测序质量上来讲,跟“人类基因组计划”公布的还不在一个水平上,所以,大部分科研工作者,还是在使用人类基因组计划所公布的基因组数据作为参考序列。

在2004年公布的“人类基因组计划”的数据中,对单个碱基的覆盖深度是6~10倍的覆盖深度,当时计算的人类基因组总长度约为2.8 G,有341个“缺口”(Gap), N50(可信的组装测序序列)的长度为38.5 Mb,这个长度是人类基因典型长度的1,000倍,应该说,在当时的测序条件下,这样的数据已经是非常好的结果了。早两年文特尔公布的基因组覆盖度为5.1倍,基因组的总长度是2.91G,从2001年发表的那个版本看,“缺口”的数量有数千个,所以从测序数据质量上来讲,较人类基因组计划还是有一定差距,且当时人类基因组计划用的是“逐个克隆法(Clone by Clone)”的定位方法测序,这种方法前期需要大量的工作进行克隆的定位,因此很费时间,而后的测序和分析则相对容易。而文特尔采用“全基因组鸟枪法”测序,这种方法不需要大量的克隆定位,但对用来组装的计算机硬件软件要求很高,且容易出错,好处在于节省了时间,提高了效率。

文特尔(左)和负责“人类基因组计划”的科林斯(右),并肩开启基因组时代的双雄人物 图片来源:time.com单就数据质量来说,人类基因组计划所得到的基因组图谱还是更加准确可靠。

但从上面的描述,我们可以看出几个问题,因为采取的基因组测序策略不同,公布的两个基因组,长度不一,“缺口”的数量不一,测序的质量也不一,从精益求精的角度看,二者都不够完美。

人类基因组:缺点在哪里?

首先,人类基因组还不够精确。人是“二倍体”,也就是有一半遗传物质来自父亲,一半遗传物质来自母亲,且在受精卵形成过程中,还会发生基因重组,这是人类遗传多样性的来源之一。科学家们需要更精确的“单倍型”数据,这样基因组才够“完美”,而这种“完美”正是研究者们追求的目标。

其次,人类基因组还不够“多元”。按照传统的人种分类,人类按照肤色黑白黄棕,被粗分为四大类:尼格罗人种、高加索人种、蒙古人种、澳大利亚人种。基因组测序数据是从高加索人种开始的,“人类基因组计划”是人类的标准参考基因组,也是高加索人种的标准参考基因组。文特尔的基因组,测序对象是他自己,同样是高加索人种。

然而,从基因组研究的角度,为了尽可能地包括各种遗传背景,需要为更多族裔建立自己的参考基因组。

第一个蒙古人种基因组,正是由华大基因团队测序完成。2008年他们在《自然》杂志发表了《一个亚洲人的二倍体基因组测序(The diploid genome sequence of an Asian individual)》, 这就是我们俗称的“炎黄一号”。同时发表的还包括来自尼格罗人种的全基因组测序数据。至此,三种肤色人种的基因组数据总算凑齐了。

2008年的华大论文中,蒙古人种基因组的覆盖深度是36倍,看似比人类基因组计划的10倍覆盖度要高出很多,事实上,蒙古人种基因组测序采用的是短序列二代测序技术,而人类基因组计划和文特尔的基因组采用的是一代测序的长序列测序。虽然炎黄一号也进行了组装,但是非常难以达到人类基因组计划的水平,而且当时二代测序技术准确度难以跟一代测序技术相媲美,所以测序质量也比较低。需要更高的覆盖深度来弥补。

这些技术细节可以简单理解成,虽然蒙古人种基因组的覆盖深度高,但是由于序列的定位可能出现问题,且质量不够高,所以,达到的效果跟10倍覆盖深度的人类基因组计划那个标准图谱在单碱基的准确度上相差不大,从结构变异和单倍型角度看,可能还有一些差距。当然,从技术角度,两套基因组测序都“不够完美”,所以不好下定论,得具体数据具体比较。

炎黄一号:九年磨砺,成就“最好”

自“炎黄一号”的第一阶段结果发表以来,华大基因的科技工作者就开始不断完善“蒙古人种”的基因组图谱。

首先是2009年,华大基因与合作单位的一群年轻研究者在《自然-生物技术》发表了研究论文《构建人类泛基因组序列图谱(Building the sequence map of the human pan-genome)》。利用组装的方法构建出炎黄一号独有的大约5M的基因序列,并且验证了其存在并预测了其功能,而且将炎黄一号的基因组组装提升到新的水平。

2011年,华大基因在《自然-生物技术》上又发表了一篇新论文,“Structural variation in two human genomes mapped at single-nucleotide resolution by whole genome de novo assembly”将炎黄一号的新组装结果与另外一个尼格罗人种的组装结果进行比对,在原有基础上,发现了277,243个新的基因组“结构变异”,同时还发布了为此开发的新的组装流程。

我们可以这么理解这项研究,2008年版本无法发现的基因组结构变异,可以通过2011年的新方法找到,特别是小范围的(≤50 碱基对)和中等范围的(51~200 碱基对)结构变异。因为炎黄一号测的是短序列,所以确实比较难发现大的结构变异(>200 碱基对),这一问题一直困扰着通过短序列高通量测序进行基因组研究的研究者。

2015年5月,华大基因在《自然-生物技术》上发表了“De novo assembly of a haplotype-resolved human genome”通过全基因组鸟枪测序法(WGS)结合全新策略(Fosmid-pooling)的分级组装方法,以及之前的二代测序短序列组装出人类单倍体水平的二倍体基因组。组装出了5.15Gb的二倍体基因组,单倍型的可信N50 为484 kb,还发现了7.49 Mb的独有序列。至此,历时9年的“炎黄一号”基因组已经趋于“完美”,这已是领先于目前已知的所有的人类基因组测序结果的最为完整的基因组图谱。

从2006年“炎黄一号”项目正式启动,到2015年5月25日《自然-生物技术》的最新论文发表。可以说,此时此刻,亚洲人在这一领域,真正领先于世界!

完美的基因组参考序列,意义何在?。

早在十年前,詹姆斯·沃森就敢于发出宣告,“未来所有生物学只有以基因组开始才有希望发展! ”

当初的预言,正在一步步变为现实。

一个真正“完美的”基因组,意义相当深远。

首先,它对遗传学研究至关重要。通过炎黄一号组装的单倍型图,我们可以更为清晰地了解不同基因型之间的连锁关系、遗传特征,进而深入研究基因组重组的机制,基因组的各种修饰与不同单倍型的关系,基因组单倍型结构与基因表达、调控、修饰的关系等等。

热门的表观遗传学也离不开基因组信息。2010年,华大的研究者在《Plos Biology》上发表过“炎黄一号”志愿者的外周血单核细胞DNA甲基化图谱,该图谱的分析是基于之前组装的版本,相信在新的组装版本的推动下,类似研究将更加深入准确。随着下一步研究延伸至志愿者的各种组织(如肌肉、皮肤等),我们将对DNA甲基化的机制和组织特异性的甲基化基因表达有更加深刻的理解。

而对于目前火热的“精准医疗”和“个体化医学”而言,准确的基因组参考序列,将帮助真正“精准”的基因组数据分析。值得庆幸的是,有“炎黄一号”作为蒙古人种的参考序列,我们将离“精准”的目标更加接近。

来源:果壳网

为你推荐

明德生物要*ST资讯

明德生物要*ST

3月22日晚间,明德生物(002932 SZ)发布2025年度业绩预告修正公告,归属于上市公司股东的净利润业绩由盈利转为亏损。

2026-03-23 22:36

迈博智星完成近亿元天使轮融资,全力推进创新抗体药物研发与管线布局资讯

迈博智星完成近亿元天使轮融资,全力推进创新抗体药物研发与管线布局

本轮融资由龙磐投资领投,巢生资本、沂景资本和元生创投共同参与投资,元燚资本担任独家财务顾问

2026-03-23 18:04

赛诺菲中国研发中心全面战略升级资讯

赛诺菲中国研发中心全面战略升级

成立公司在华规模最大的转化医学研究中心,实现全球协作与本地产学研深度融合

2026-03-23 17:57

赶早赴约,忆路守护 礼来携手清华大学阿尔茨海默病科普创意大赛圆满收官资讯

赶早赴约,忆路守护 礼来携手清华大学阿尔茨海默病科普创意大赛圆满收官

今日,由礼来主办,清华大学承办的 “赶早赴约,忆路守护” 阿尔茨海默病(AD)科普创意大赛颁奖典礼在清华大学圆满落幕。

2026-03-23 17:48

健康小美+蚂蚁阿福,美年健康与蚂蚁健康推动AI医疗深度合作资讯

健康小美+蚂蚁阿福,美年健康与蚂蚁健康推动AI医疗深度合作

3月23日,美年健康与蚂蚁健康宣布达成全面战略合作。双方将依托美年长期沉淀的专业健康数据体系、覆盖全国的线下医疗服务网络,以及医学检测设备与标准化医疗服务能力所构成的这...

2026-03-23 17:06

迪哲医药舒沃哲单药一线治疗EGFR exon20ins非小细胞肺癌国际多中心III期临床试验获阳性顶线结果资讯

迪哲医药舒沃哲单药一线治疗EGFR exon20ins非小细胞肺癌国际多中心III期临床试验获阳性顶线结果

3月23日,迪哲医药发布公告称,其自主研发的产品舒沃哲(ZEGFROVY,通用名:舒沃替尼片)单药一线治疗表皮生长因子受体(EGFR)20 号外显子插入突变(exon20ins)晚期非小细胞...

2026-03-23 10:45

远葆医疗完成数千万元天使轮融资,布局神经康复与脑机接口领域资讯

远葆医疗完成数千万元天使轮融资,布局神经康复与脑机接口领域

本轮融资由上海科创集团旗下知识产权基金独家战略投资

2026-03-22 19:10

全球首创!蠕形螨睑缘炎创新眼药GPN01768国内正式获批资讯

全球首创!蠕形螨睑缘炎创新眼药GPN01768国内正式获批

GPN01768是美国FDA批准的首款、全球首创、也是目前全球唯一专门用于治疗蠕形螨睑缘炎的药物

2026-03-22 18:58

拓展入境健康消费,探索建设国际医疗旅游集聚区资讯

拓展入境健康消费,探索建设国际医疗旅游集聚区

统筹中国游、中国购、中国学、中国医等多维体验,系统构建“你好!中国”国家旅游形象,打造“中国游”品牌。

2026-03-21 20:47

DRG/DIP 3.0 的最新消息资讯

DRG/DIP 3.0 的最新消息

2026年3月19日上午,国家医保局开展按病种付费分组方案3 0版调整情况介绍活动。

2026-03-20 22:32

创新“无棉”静音技术,可孚医疗发布首款智能呼吸机资讯

创新“无棉”静音技术,可孚医疗发布首款智能呼吸机

3月20日,正值世界睡眠日到来之际,可孚医疗隆重举行呼吸机新品发布会,正式推出行业率先实现的无消音棉超静音AI智能呼吸机——C11。

2026-03-20 19:02

NVIDIA GTC 大会重磅发布:以 AI 与算力赋能药物研发全链路创新资讯

NVIDIA GTC 大会重磅发布:以 AI 与算力赋能药物研发全链路创新

在 GTC 大会上,NVIDIA 集中展示了其在制药与生命科学领域的核心技术成果与深度行业合作

2026-03-20 14:21

深耕肾病与代谢领域,炫景生物完成超2亿元Pre-A轮融资资讯

深耕肾病与代谢领域,炫景生物完成超2亿元Pre-A轮融资

本轮融资由康君资本领投,德联资本、华泰金斯瑞基金、金易赋新、国海创新资本、联想创投等机构联合参投,现有股东元希海河继续跟投

2026-03-20 13:52

先衍生物完成1.5亿元A轮融资,加速小核酸药物核心技术突破与管线推进资讯

先衍生物完成1.5亿元A轮融资,加速小核酸药物核心技术突破与管线推进

本轮融资由道远资本领投,启申创投联合领投,嘉乐资本、成都科创投集团、四川省中试研发有限公司、厦门高新投、增锐铭禾等机构跟投,同时成都先导、银满基金、怀格资本、钧天创...

2026-03-20 13:48

聚焦“三高一疹”共病联防,“乐龄健康第一课”全面升级、在沪开讲资讯

聚焦“三高一疹”共病联防,“乐龄健康第一课”全面升级、在沪开讲

多领域专家齐聚沪上“文化会客厅”,共话“小处方”背后的温情守护

2026-03-20 13:32

华海药业PD-L1/VEGF将正式启动子宫内膜癌的Ⅲ期临床试验资讯

华海药业PD-L1/VEGF将正式启动子宫内膜癌的Ⅲ期临床试验

3月19日,华海药业发布公告称,近日,下属子公司上海华奥泰生物药业股份有限公司就HB0025联合化疗一线治疗晚期 复发子宫内膜癌经过与国家药品监督管理局药品审评中心(CDE)Ⅱ...

2026-03-20 10:40

天宜康医药完成逾亿元种子轮融资,汪文博士领衔攻坚CAR-T行业核心痛点资讯

天宜康医药完成逾亿元种子轮融资,汪文博士领衔攻坚CAR-T行业核心痛点

本轮融资由弘毅投资和幂方健康基金共同领投,苏创投、承树投资、英贤投资及毅达资本跟投

2026-03-19 13:19

爱尔康披露关键数据:全球老视矫正型人工晶体植入量超600万枚,人工晶体植入总量突破1.75亿枚资讯

爱尔康披露关键数据:全球老视矫正型人工晶体植入量超600万枚,人工晶体植入总量突破1.75亿枚

全球人工晶体(IOL)植入技术在临床应用中不断取得新进展,为患者术后视觉质量的提升提供了更多可能性。

2026-03-19 13:08

赛诺菲首个中国创新与运营中心落户成都资讯

赛诺菲首个中国创新与运营中心落户成都

汇聚本土人才,赋能数字生态,共促医药创新转型升级

2026-03-19 13:04