“炎黄一号” 测序数据质量世界第一

医疗器械 来源:果壳网
2015
05/29
17:00
果壳网 医疗器械


2015年5月25日,《自然-生物技术》发表了来自华大基因的“炎黄一号”单倍型组装结果。

2008年,“炎黄一号”一诞生即成为“亚洲第一”——第一个蒙古人种的全基因组测序结果。经过科学家的不懈打磨,到《自然-生物技术》这篇最新论文发表的那一刻,从测序数据质量上来说,“炎黄一号”终于成了“世界第一”!

作为和这项研究有些渊源的基因组学工作者,笔者将尽我所能,解读“炎黄一号”基因组的系列科研和技术进展。以期让大家理解,个人全基因组测序现在究竟进展到了什么地步?这项工作的意义和价值又在哪里?

基因组数据:能用,但还不够好

在这个“千元基因组时代”,个人基因组测序似乎已成了大众消费品。那么,为什么世界顶级的基因组研究机构和测序仪生产商,还在不断的测序更多的个人基因组,还要将个人基因组研究做到目前技术条件下“极致精美”的程度呢?

简单的答案就是,因为目前的基因组数据还不够好,因而也不够好用。

我们研究人类基因组最关心的问题,就是将染色体上所有的基因序列都测序出来,并且定位清楚,简单的说,目标就是将人类基因组从第一个碱基开始,一直到最后一个碱基结束,真正完整的呈现出来。

在基因组研究领域,人们对数据的可信度有一个基本的要求:单个碱基越准确越好,对单个碱基的覆盖深度越多倍越好,对整个基因组测得越完整越好,测序的“缺口”越少越好。

以这些标准看,目前的基因组测序结果,还没有一个是完美的。

人类基因组计划:曾经的“最好”

自从“人类基因组计划”和科学狂人克雷格· 文特尔(Craig Venter)先后公布人类基因组图谱以来,基因组研究进入了全新的纪元。然而,这份图谱只是张“不够完美的参考图”,科学家们很快认识到,我们需要更多人的基因组, 才能真正将遗传与基因组信息应用到健康和临床领域。

但是因为测序基因组太过昂贵,科学家们选择了折衷的思路,那就是后来启动的国际人类基因组单体型图计划( HapMap Project),旨在了解人类遗传的单倍型和单点突变。虽然取得了一定的进展,但是根本问题仍然存在——测序的人类基因组数据太少,质量还不够好。

再后来,454公司测序了诺奖得主詹姆斯·沃森(James Watson)的基因组,并将其公布,但是沃森的基因组从测序质量上来讲,跟“人类基因组计划”公布的还不在一个水平上,所以,大部分科研工作者,还是在使用人类基因组计划所公布的基因组数据作为参考序列。

在2004年公布的“人类基因组计划”的数据中,对单个碱基的覆盖深度是6~10倍的覆盖深度,当时计算的人类基因组总长度约为2.8 G,有341个“缺口”(Gap), N50(可信的组装测序序列)的长度为38.5 Mb,这个长度是人类基因典型长度的1,000倍,应该说,在当时的测序条件下,这样的数据已经是非常好的结果了。早两年文特尔公布的基因组覆盖度为5.1倍,基因组的总长度是2.91G,从2001年发表的那个版本看,“缺口”的数量有数千个,所以从测序数据质量上来讲,较人类基因组计划还是有一定差距,且当时人类基因组计划用的是“逐个克隆法(Clone by Clone)”的定位方法测序,这种方法前期需要大量的工作进行克隆的定位,因此很费时间,而后的测序和分析则相对容易。而文特尔采用“全基因组鸟枪法”测序,这种方法不需要大量的克隆定位,但对用来组装的计算机硬件软件要求很高,且容易出错,好处在于节省了时间,提高了效率。

文特尔(左)和负责“人类基因组计划”的科林斯(右),并肩开启基因组时代的双雄人物 图片来源:time.com单就数据质量来说,人类基因组计划所得到的基因组图谱还是更加准确可靠。

但从上面的描述,我们可以看出几个问题,因为采取的基因组测序策略不同,公布的两个基因组,长度不一,“缺口”的数量不一,测序的质量也不一,从精益求精的角度看,二者都不够完美。

人类基因组:缺点在哪里?

首先,人类基因组还不够精确。人是“二倍体”,也就是有一半遗传物质来自父亲,一半遗传物质来自母亲,且在受精卵形成过程中,还会发生基因重组,这是人类遗传多样性的来源之一。科学家们需要更精确的“单倍型”数据,这样基因组才够“完美”,而这种“完美”正是研究者们追求的目标。

其次,人类基因组还不够“多元”。按照传统的人种分类,人类按照肤色黑白黄棕,被粗分为四大类:尼格罗人种、高加索人种、蒙古人种、澳大利亚人种。基因组测序数据是从高加索人种开始的,“人类基因组计划”是人类的标准参考基因组,也是高加索人种的标准参考基因组。文特尔的基因组,测序对象是他自己,同样是高加索人种。

然而,从基因组研究的角度,为了尽可能地包括各种遗传背景,需要为更多族裔建立自己的参考基因组。

第一个蒙古人种基因组,正是由华大基因团队测序完成。2008年他们在《自然》杂志发表了《一个亚洲人的二倍体基因组测序(The diploid genome sequence of an Asian individual)》, 这就是我们俗称的“炎黄一号”。同时发表的还包括来自尼格罗人种的全基因组测序数据。至此,三种肤色人种的基因组数据总算凑齐了。

2008年的华大论文中,蒙古人种基因组的覆盖深度是36倍,看似比人类基因组计划的10倍覆盖度要高出很多,事实上,蒙古人种基因组测序采用的是短序列二代测序技术,而人类基因组计划和文特尔的基因组采用的是一代测序的长序列测序。虽然炎黄一号也进行了组装,但是非常难以达到人类基因组计划的水平,而且当时二代测序技术准确度难以跟一代测序技术相媲美,所以测序质量也比较低。需要更高的覆盖深度来弥补。

这些技术细节可以简单理解成,虽然蒙古人种基因组的覆盖深度高,但是由于序列的定位可能出现问题,且质量不够高,所以,达到的效果跟10倍覆盖深度的人类基因组计划那个标准图谱在单碱基的准确度上相差不大,从结构变异和单倍型角度看,可能还有一些差距。当然,从技术角度,两套基因组测序都“不够完美”,所以不好下定论,得具体数据具体比较。

炎黄一号:九年磨砺,成就“最好”

自“炎黄一号”的第一阶段结果发表以来,华大基因的科技工作者就开始不断完善“蒙古人种”的基因组图谱。

首先是2009年,华大基因与合作单位的一群年轻研究者在《自然-生物技术》发表了研究论文《构建人类泛基因组序列图谱(Building the sequence map of the human pan-genome)》。利用组装的方法构建出炎黄一号独有的大约5M的基因序列,并且验证了其存在并预测了其功能,而且将炎黄一号的基因组组装提升到新的水平。

2011年,华大基因在《自然-生物技术》上又发表了一篇新论文,“Structural variation in two human genomes mapped at single-nucleotide resolution by whole genome de novo assembly”将炎黄一号的新组装结果与另外一个尼格罗人种的组装结果进行比对,在原有基础上,发现了277,243个新的基因组“结构变异”,同时还发布了为此开发的新的组装流程。

我们可以这么理解这项研究,2008年版本无法发现的基因组结构变异,可以通过2011年的新方法找到,特别是小范围的(≤50 碱基对)和中等范围的(51~200 碱基对)结构变异。因为炎黄一号测的是短序列,所以确实比较难发现大的结构变异(>200 碱基对),这一问题一直困扰着通过短序列高通量测序进行基因组研究的研究者。

2015年5月,华大基因在《自然-生物技术》上发表了“De novo assembly of a haplotype-resolved human genome”通过全基因组鸟枪测序法(WGS)结合全新策略(Fosmid-pooling)的分级组装方法,以及之前的二代测序短序列组装出人类单倍体水平的二倍体基因组。组装出了5.15Gb的二倍体基因组,单倍型的可信N50 为484 kb,还发现了7.49 Mb的独有序列。至此,历时9年的“炎黄一号”基因组已经趋于“完美”,这已是领先于目前已知的所有的人类基因组测序结果的最为完整的基因组图谱。

从2006年“炎黄一号”项目正式启动,到2015年5月25日《自然-生物技术》的最新论文发表。可以说,此时此刻,亚洲人在这一领域,真正领先于世界!

完美的基因组参考序列,意义何在?。

早在十年前,詹姆斯·沃森就敢于发出宣告,“未来所有生物学只有以基因组开始才有希望发展! ”

当初的预言,正在一步步变为现实。

一个真正“完美的”基因组,意义相当深远。

首先,它对遗传学研究至关重要。通过炎黄一号组装的单倍型图,我们可以更为清晰地了解不同基因型之间的连锁关系、遗传特征,进而深入研究基因组重组的机制,基因组的各种修饰与不同单倍型的关系,基因组单倍型结构与基因表达、调控、修饰的关系等等。

热门的表观遗传学也离不开基因组信息。2010年,华大的研究者在《Plos Biology》上发表过“炎黄一号”志愿者的外周血单核细胞DNA甲基化图谱,该图谱的分析是基于之前组装的版本,相信在新的组装版本的推动下,类似研究将更加深入准确。随着下一步研究延伸至志愿者的各种组织(如肌肉、皮肤等),我们将对DNA甲基化的机制和组织特异性的甲基化基因表达有更加深刻的理解。

而对于目前火热的“精准医疗”和“个体化医学”而言,准确的基因组参考序列,将帮助真正“精准”的基因组数据分析。值得庆幸的是,有“炎黄一号”作为蒙古人种的参考序列,我们将离“精准”的目标更加接近。

来源:果壳网

为你推荐

天津市互联网诊疗监管实施办法(试行)资讯

天津市互联网诊疗监管实施办法(试行)

医疗机构应当主动与市级监管平台对接,及时上传、更新《医疗机构执业许可证》等相关执业信息,主动接受监督。医疗机构取得《医疗机构执业许可证》后或《医疗机构执业许可证》变...

2026-02-06 08:59

八部委发布《中药工业高质量发展实施方案(2026—2030年)》资讯

八部委发布《中药工业高质量发展实施方案(2026—2030年)》

培育60个高标准中药原料生产基地。协同体系更加健全,中药材种植加工、中药研发生产、流通服务等上下游各环节协同更加紧密,建设5个中药工业守正创新中心,推动一批中药创新药获...

2026-02-05 21:21

国家医保局今年将重点对精神类定点医疗机构开展专项飞检资讯

国家医保局今年将重点对精神类定点医疗机构开展专项飞检

各省级医保部门要组织本辖区内所有精神类定点医疗机构从即日起全面开展自查自纠,重点聚焦但不限于诱导住院、虚假住院、虚构病情、虚构诊疗、伪造文书、违规收费等违法违规使用...

2026-02-05 17:13

替尔泊肽登顶“全球药王”资讯

替尔泊肽登顶“全球药王”

2月4日晚间,礼来发布2025年第四季度及全年财报。财报显示,公司全年营收、净利润均实现大幅增长。

2026-02-05 16:26

蚂蚁阿福发布“长辈模式”资讯

蚂蚁阿福发布“长辈模式”

2月4日消息,蚂蚁阿福App近日完成重要升级,上线专为老年用户设计的长辈模式。

2026-02-05 14:54

国际SOS荣膺“2026年度全球杰出雇主”资讯

国际SOS荣膺“2026年度全球杰出雇主”

今日,国际SOS宣布,公司连续第八年荣获杰出雇主调研机构(Top Employers Institute)授予的杰出雇主认证。

2026-02-05 14:42

默克高管周虹离任,诺和诺德官宣在即,医药行业再迎关键人事变动资讯

默克高管周虹离任,诺和诺德官宣在即,医药行业再迎关键人事变动

默克医药健康全球执行副总裁、中国及国际市场负责人周虹正式离任,其将加盟丹麦制药巨头诺和诺德,接任产品与组合战略执行副总裁一职

2026-02-05 11:58

104亿元!2026年小核酸领域首笔出海BD诞生资讯

104亿元!2026年小核酸领域首笔出海BD诞生

圣因生物与罗氏集团旗下子公司基因泰克达成全球研发合作与许可协议,双方将基于圣因生物专有的RNAi药物研发平台,共同推进一款RNAi疗法的开发。

2026-02-05 11:50

“向光而生·同心前行”2026年世界癌症日特别活动在沪举办资讯

“向光而生·同心前行”2026年世界癌症日特别活动在沪举办

以患者为中心,多方携手共绘癌症科学诊疗新蓝图

2026-02-04 13:13

合成生物企业桦冠生物宣布完成数亿元C轮融资资讯

合成生物企业桦冠生物宣布完成数亿元C轮融资

本轮融资由软银欣创、顺禧基金、常州启航合成生物创投基金、国投创益、长江资本等多家知名机构联合投资,光源资本担任财务顾问,所融资金将重点投向医药与大健康领域新品研发、...

2026-02-04 11:50

AI制药独角兽深度智耀完成6000万美元新一轮融资,加速全栈式研发解决方案落地资讯

AI制药独角兽深度智耀完成6000万美元新一轮融资,加速全栈式研发解决方案落地

本轮融资吸引了信宸资本、金镒资本、凯泰资本等新投资方入局,老股东鼎晖百孚、新鼎资本持续追加投资

2026-02-03 20:03

济川药业联合康方生物,共拓心血管创新药商业化新局资讯

济川药业联合康方生物,共拓心血管创新药商业化新局

伊喜宁®(伊努西单抗注射液)是康方生物自主开发创新的PCSK9单克隆抗体新药,于2024年9月获批上市,用于治疗原发性高胆固醇血症和混合型高脂血症,包括杂合子家族性高胆固醇血...

2026-02-03 19:34

华东医药创新药罗氟司特乳膏0.05%特应性皮炎适应症申报上市资讯

华东医药创新药罗氟司特乳膏0.05%特应性皮炎适应症申报上市

适用于2岁至5岁轻度至中度特应性皮炎患者的局部外用治疗

2026-02-03 19:29

拜耳诺倍戈®第三项适应症在中国获批,用于治疗转移性激素敏感性前列腺癌(mHSPC)

诺倍戈®此前已先后获批用于治疗有高危转移风险的非转移性去势抵抗性前列腺癌(NM-CRPC)成年患者,和联合多西他赛治疗转移性激素敏感性前列腺癌的(mHSPC)成年患者。

2026-02-03 18:42

第101批仿制药参比制剂目录资讯

第101批仿制药参比制剂目录

经国家药品监督管理局仿制药质量和疗效一致性评价专家委员会审核确定,现发布仿制药参比制剂目录(第一百零一批)。

2026-02-03 13:19

支付宝集五福2月3日0点开启,新增“健康福”资讯

支付宝集五福2月3日0点开启,新增“健康福”

2月3日0点,一年一度的春节“支付宝集福”活动将正式上线,活动将持续至除夕夜。

2026-02-02 14:27

又一款老花眼滴眼液获批,市场有待检验资讯

又一款老花眼滴眼液获批,市场有待检验

近日,Tenpoint Therapeutics宣布,美国FDA已批准Yuvezzi(carbachol和brimonidine tartrate滴眼液,2 75% 0 1%),用于治疗成人老花眼。

2026-02-02 14:06

深度缓解数据惊艳:基于诺奖机制的 CELMoD药物如何重塑 MM 治疗逻辑?  资讯

深度缓解数据惊艳:基于诺奖机制的 CELMoD药物如何重塑 MM 治疗逻辑?

近期,国家药品监督管理局药品审评中心(CDE)将CELMoD药物 iberdomide (以下简称:IBER)纳入优先审评名单并启动优先审评程序,拟批准

2026-02-02 13:22

今日起,医疗药品、保健食品、特殊医学用途配方食品、医疗器械难以电商直播资讯

今日起,医疗药品、保健食品、特殊医学用途配方食品、医疗器械难以电商直播

2月1日,《直播电商监督管理办法》正式实施。

2026-02-01 14:14

儿童生长发育专业、儿童营养专业、儿童皮肤疾病专业纳入北京互联网诊疗首诊试点资讯

儿童生长发育专业、儿童营养专业、儿童皮肤疾病专业纳入北京互联网诊疗首诊试点

经研究,同意你委依托首都医科大学附属北京儿童医院和首都医科大学附属首都儿童医学中心开展儿童生长发育专业、儿童营养专业、儿童皮肤疾病专业互联网诊疗首诊试点。

2026-01-31 23:34