“炎黄一号” 测序数据质量世界第一

医疗器械 来源:果壳网
2015
05/29
17:00
果壳网 医疗器械


2015年5月25日,《自然-生物技术》发表了来自华大基因的“炎黄一号”单倍型组装结果。

2008年,“炎黄一号”一诞生即成为“亚洲第一”——第一个蒙古人种的全基因组测序结果。经过科学家的不懈打磨,到《自然-生物技术》这篇最新论文发表的那一刻,从测序数据质量上来说,“炎黄一号”终于成了“世界第一”!

作为和这项研究有些渊源的基因组学工作者,笔者将尽我所能,解读“炎黄一号”基因组的系列科研和技术进展。以期让大家理解,个人全基因组测序现在究竟进展到了什么地步?这项工作的意义和价值又在哪里?

基因组数据:能用,但还不够好

在这个“千元基因组时代”,个人基因组测序似乎已成了大众消费品。那么,为什么世界顶级的基因组研究机构和测序仪生产商,还在不断的测序更多的个人基因组,还要将个人基因组研究做到目前技术条件下“极致精美”的程度呢?

简单的答案就是,因为目前的基因组数据还不够好,因而也不够好用。

我们研究人类基因组最关心的问题,就是将染色体上所有的基因序列都测序出来,并且定位清楚,简单的说,目标就是将人类基因组从第一个碱基开始,一直到最后一个碱基结束,真正完整的呈现出来。

在基因组研究领域,人们对数据的可信度有一个基本的要求:单个碱基越准确越好,对单个碱基的覆盖深度越多倍越好,对整个基因组测得越完整越好,测序的“缺口”越少越好。

以这些标准看,目前的基因组测序结果,还没有一个是完美的。

人类基因组计划:曾经的“最好”

自从“人类基因组计划”和科学狂人克雷格· 文特尔(Craig Venter)先后公布人类基因组图谱以来,基因组研究进入了全新的纪元。然而,这份图谱只是张“不够完美的参考图”,科学家们很快认识到,我们需要更多人的基因组, 才能真正将遗传与基因组信息应用到健康和临床领域。

但是因为测序基因组太过昂贵,科学家们选择了折衷的思路,那就是后来启动的国际人类基因组单体型图计划( HapMap Project),旨在了解人类遗传的单倍型和单点突变。虽然取得了一定的进展,但是根本问题仍然存在——测序的人类基因组数据太少,质量还不够好。

再后来,454公司测序了诺奖得主詹姆斯·沃森(James Watson)的基因组,并将其公布,但是沃森的基因组从测序质量上来讲,跟“人类基因组计划”公布的还不在一个水平上,所以,大部分科研工作者,还是在使用人类基因组计划所公布的基因组数据作为参考序列。

在2004年公布的“人类基因组计划”的数据中,对单个碱基的覆盖深度是6~10倍的覆盖深度,当时计算的人类基因组总长度约为2.8 G,有341个“缺口”(Gap), N50(可信的组装测序序列)的长度为38.5 Mb,这个长度是人类基因典型长度的1,000倍,应该说,在当时的测序条件下,这样的数据已经是非常好的结果了。早两年文特尔公布的基因组覆盖度为5.1倍,基因组的总长度是2.91G,从2001年发表的那个版本看,“缺口”的数量有数千个,所以从测序数据质量上来讲,较人类基因组计划还是有一定差距,且当时人类基因组计划用的是“逐个克隆法(Clone by Clone)”的定位方法测序,这种方法前期需要大量的工作进行克隆的定位,因此很费时间,而后的测序和分析则相对容易。而文特尔采用“全基因组鸟枪法”测序,这种方法不需要大量的克隆定位,但对用来组装的计算机硬件软件要求很高,且容易出错,好处在于节省了时间,提高了效率。

文特尔(左)和负责“人类基因组计划”的科林斯(右),并肩开启基因组时代的双雄人物 图片来源:time.com单就数据质量来说,人类基因组计划所得到的基因组图谱还是更加准确可靠。

但从上面的描述,我们可以看出几个问题,因为采取的基因组测序策略不同,公布的两个基因组,长度不一,“缺口”的数量不一,测序的质量也不一,从精益求精的角度看,二者都不够完美。

人类基因组:缺点在哪里?

首先,人类基因组还不够精确。人是“二倍体”,也就是有一半遗传物质来自父亲,一半遗传物质来自母亲,且在受精卵形成过程中,还会发生基因重组,这是人类遗传多样性的来源之一。科学家们需要更精确的“单倍型”数据,这样基因组才够“完美”,而这种“完美”正是研究者们追求的目标。

其次,人类基因组还不够“多元”。按照传统的人种分类,人类按照肤色黑白黄棕,被粗分为四大类:尼格罗人种、高加索人种、蒙古人种、澳大利亚人种。基因组测序数据是从高加索人种开始的,“人类基因组计划”是人类的标准参考基因组,也是高加索人种的标准参考基因组。文特尔的基因组,测序对象是他自己,同样是高加索人种。

然而,从基因组研究的角度,为了尽可能地包括各种遗传背景,需要为更多族裔建立自己的参考基因组。

第一个蒙古人种基因组,正是由华大基因团队测序完成。2008年他们在《自然》杂志发表了《一个亚洲人的二倍体基因组测序(The diploid genome sequence of an Asian individual)》, 这就是我们俗称的“炎黄一号”。同时发表的还包括来自尼格罗人种的全基因组测序数据。至此,三种肤色人种的基因组数据总算凑齐了。

2008年的华大论文中,蒙古人种基因组的覆盖深度是36倍,看似比人类基因组计划的10倍覆盖度要高出很多,事实上,蒙古人种基因组测序采用的是短序列二代测序技术,而人类基因组计划和文特尔的基因组采用的是一代测序的长序列测序。虽然炎黄一号也进行了组装,但是非常难以达到人类基因组计划的水平,而且当时二代测序技术准确度难以跟一代测序技术相媲美,所以测序质量也比较低。需要更高的覆盖深度来弥补。

这些技术细节可以简单理解成,虽然蒙古人种基因组的覆盖深度高,但是由于序列的定位可能出现问题,且质量不够高,所以,达到的效果跟10倍覆盖深度的人类基因组计划那个标准图谱在单碱基的准确度上相差不大,从结构变异和单倍型角度看,可能还有一些差距。当然,从技术角度,两套基因组测序都“不够完美”,所以不好下定论,得具体数据具体比较。

炎黄一号:九年磨砺,成就“最好”

自“炎黄一号”的第一阶段结果发表以来,华大基因的科技工作者就开始不断完善“蒙古人种”的基因组图谱。

首先是2009年,华大基因与合作单位的一群年轻研究者在《自然-生物技术》发表了研究论文《构建人类泛基因组序列图谱(Building the sequence map of the human pan-genome)》。利用组装的方法构建出炎黄一号独有的大约5M的基因序列,并且验证了其存在并预测了其功能,而且将炎黄一号的基因组组装提升到新的水平。

2011年,华大基因在《自然-生物技术》上又发表了一篇新论文,“Structural variation in two human genomes mapped at single-nucleotide resolution by whole genome de novo assembly”将炎黄一号的新组装结果与另外一个尼格罗人种的组装结果进行比对,在原有基础上,发现了277,243个新的基因组“结构变异”,同时还发布了为此开发的新的组装流程。

我们可以这么理解这项研究,2008年版本无法发现的基因组结构变异,可以通过2011年的新方法找到,特别是小范围的(≤50 碱基对)和中等范围的(51~200 碱基对)结构变异。因为炎黄一号测的是短序列,所以确实比较难发现大的结构变异(>200 碱基对),这一问题一直困扰着通过短序列高通量测序进行基因组研究的研究者。

2015年5月,华大基因在《自然-生物技术》上发表了“De novo assembly of a haplotype-resolved human genome”通过全基因组鸟枪测序法(WGS)结合全新策略(Fosmid-pooling)的分级组装方法,以及之前的二代测序短序列组装出人类单倍体水平的二倍体基因组。组装出了5.15Gb的二倍体基因组,单倍型的可信N50 为484 kb,还发现了7.49 Mb的独有序列。至此,历时9年的“炎黄一号”基因组已经趋于“完美”,这已是领先于目前已知的所有的人类基因组测序结果的最为完整的基因组图谱。

从2006年“炎黄一号”项目正式启动,到2015年5月25日《自然-生物技术》的最新论文发表。可以说,此时此刻,亚洲人在这一领域,真正领先于世界!

完美的基因组参考序列,意义何在?。

早在十年前,詹姆斯·沃森就敢于发出宣告,“未来所有生物学只有以基因组开始才有希望发展! ”

当初的预言,正在一步步变为现实。

一个真正“完美的”基因组,意义相当深远。

首先,它对遗传学研究至关重要。通过炎黄一号组装的单倍型图,我们可以更为清晰地了解不同基因型之间的连锁关系、遗传特征,进而深入研究基因组重组的机制,基因组的各种修饰与不同单倍型的关系,基因组单倍型结构与基因表达、调控、修饰的关系等等。

热门的表观遗传学也离不开基因组信息。2010年,华大的研究者在《Plos Biology》上发表过“炎黄一号”志愿者的外周血单核细胞DNA甲基化图谱,该图谱的分析是基于之前组装的版本,相信在新的组装版本的推动下,类似研究将更加深入准确。随着下一步研究延伸至志愿者的各种组织(如肌肉、皮肤等),我们将对DNA甲基化的机制和组织特异性的甲基化基因表达有更加深刻的理解。

而对于目前火热的“精准医疗”和“个体化医学”而言,准确的基因组参考序列,将帮助真正“精准”的基因组数据分析。值得庆幸的是,有“炎黄一号”作为蒙古人种的参考序列,我们将离“精准”的目标更加接近。

来源:果壳网

为你推荐

国家药监局支持创新药发展,拟30个工作日内完成临床试验申请的审评审批资讯

国家药监局支持创新药发展,拟30个工作日内完成临床试验申请的审评审批

纳入创新药临床试验审评审批30日通道的申请,应当为中药、化学药品、生物制品1类创新药。

2025-06-16 22:04

诺和诺德与阿里健康启动战略合作,助力慢病管理数字化升级资讯

诺和诺德与阿里健康启动战略合作,助力慢病管理数字化升级

2025年6月16日,诺和诺德与阿里健康宣布达成战略合作。在国家持续推进“体重管理年”行动的背景下,双方将依托诺和诺德百余年深耕慢病领域的专业经验和创新治疗方案,以及阿里健...

2025-06-16 14:58

治疗阿尔茨海默病国产新药断货与思考资讯

治疗阿尔茨海默病国产新药断货与思考

近日,许多患者家属反映买不到治疗阿尔茨海病的新药甘露特钠胶囊,经过了解,也证实该药在许多医院和药店确实“断货”,作为中国治疗阿尔茨海默病处方量最大的药物之一,也是目...

文/上海市精神卫生中心肖世富 广州医科大学附属第二医院刘军 北京和睦家医院李慧英 2025-06-16 11:35

连续第四年,2025年纠正医药购销领域和医疗服务中不正之风工作要点发布资讯

连续第四年,2025年纠正医药购销领域和医疗服务中不正之风工作要点发布

发挥穿透式审计监督优势,加强医药行业专项审计。打通从原材料采购、药品耗材生产、招标采购的监管通路,将监管重点向生产端覆盖。探索建立药品生产加工到流通使用全过程可追溯...

2025-06-13 22:55

国家卫健委:人间传染的高致病性病原微生物实验活动审批管理办法资讯

国家卫健委:人间传染的高致病性病原微生物实验活动审批管理办法

本办法适用于三级、 四级实验室从事《人间传染的病原微生物目录》 规定的应当在三级、 四级实验室开展的人间传染的高致病性病原微生物或者疑似高致病性病原微生物实验活动的审批。

2025-06-13 22:34

半年融资超2亿元,美创医疗攻克“卡脖子”技术资讯

半年融资超2亿元,美创医疗攻克“卡脖子”技术

此次融资将加速美创医疗在医用植入级ePTFE材料产线建设、创新产品研发及商业化推广上的布局,助推中国高端医疗器械真正实现进口替代。

2025-06-13 13:22

拟再易主,派林生物或变为央企控股企业资讯

拟再易主,派林生物或变为央企控股企业

日前,派林生物发布公告称,中国生物技与派林生物控股股东共青城胜帮英豪投资合伙企业(简称“胜帮英豪”)签署收购框架协议,拟受让后者持有的21 03%股份。若本次交易顺利推进...

2025-06-13 12:43

依视路®星趣控®亮相Vision China 2025,重磅发布依视路®星趣控®2.0镜片资讯

依视路®星趣控®亮相Vision China 2025,重磅发布依视路®星趣控®2.0镜片

在2025年视觉健康创新发展国际会议(Vision China)期间,儿童青少年近视管理品牌依视路®星趣控®重磅发布全“星”一代儿童青少年解决方案——依视路®星趣控®2 0镜片

2025-06-13 11:28

景嘉航完成数千万元天使轮融资,专注新型靶向放射性药物开发资讯

景嘉航完成数千万元天使轮融资,专注新型靶向放射性药物开发

近日,杭州景嘉航生物医药科技有限公司(AB-RayBio Therapeutics,简称“景嘉航”)完成数千万元人民币的天使轮融资,由杭实资管领投,正

2025-06-13 10:53

CDE:已取得药品批准文号的两种或者两种以上具有独立的适应症和用法用量的化学药品,如何申请组合包装?资讯

CDE:已取得药品批准文号的两种或者两种以上具有独立的适应症和用法用量的化学药品,如何申请组合包装?

已取得药品批准文号的两种或者两种以上具有独立的适应症和用法用量的化学药品,如申请组合包装,应通过什么途径提出申请,申报资料有什么要求?

2025-06-12 21:44

赛诺菲加速尼塞韦单抗全球发货,提前数月助力医务工作者应对今年RSV流行季资讯

赛诺菲加速尼塞韦单抗全球发货,提前数月助力医务工作者应对今年RSV流行季

赛诺菲将于2025年第三季度初启动尼塞韦单抗的全球发货工作,以确保在2025-2026年呼吸道合胞病毒流行季来临前,实现广泛供应。

2025-06-12 17:31

瑞辅达医疗完成数千万元B轮融资,加速国产辅助生殖技术创新与全球化布局资讯

瑞辅达医疗完成数千万元B轮融资,加速国产辅助生殖技术创新与全球化布局

由中金资本管理的基金领投,连云港经济技术开发区产业基金跟投

2025-06-12 16:16

因诺惟康完成数千万元A+轮融资,深耕基因递送技术临床转化与平台创新资讯

因诺惟康完成数千万元A+轮融资,深耕基因递送技术临床转化与平台创新

由天创资本领投,新投资人及老股东跟投

2025-06-12 15:51

CDE发布《先进治疗药品的范围、归类和释义(征求意见稿)》资讯

CDE发布《先进治疗药品的范围、归类和释义(征求意见稿)》

本文件所称先进治疗药品,是指符合药品相关管理规定,按照药品的路径进行研制、生产、经营、 使用和监管,且经体外操作生产并在人体内发挥预期功能的细胞治疗药品、基因治疗药...

2025-06-11 22:06

安图生物注销了一控股子公司资讯

安图生物注销了一控股子公司

近日,安图生物发布公告称,公司控股子公司安图莫比已完成注销手续,该公司是安图生物与Mobidiag Oy(以下简称Mobidiag)在6年前成立的合资企业,伴随着注销,如今正式落幕。

2025-06-11 15:25

因美纳发布2024年度企业社会责任报告,持续释放基因组学的力量资讯

因美纳发布2024年度企业社会责任报告,持续释放基因组学的力量

报告重点阐述了因美纳在推动精准医疗更加可及、赋能公众与社群、在业务中践行可持续发展、尽责运营和秉持诚信领导原则等方面的持续努力。

2025-06-11 14:21

破解传统疗法局限,华东医药脂溢性皮炎外用制剂国内III期临床获批资讯

破解传统疗法局限,华东医药脂溢性皮炎外用制剂国内III期临床获批

由中美华东申报的一项评价0 3%罗氟司特泡沫(ZORYVE®)在脂溢性皮炎患者中有效性和安全性的多中心、随机、双盲、赋形剂平行对照的III期临床试验申请获得批准。

2025-06-11 09:57

医药领域有哪些新探索,中办 国办关于深入推进深圳综合改革试点深化改革创新扩大开放的意见资讯

医药领域有哪些新探索,中办 国办关于深入推进深圳综合改革试点深化改革创新扩大开放的意见

深化药品医疗器械审评审批制度改革,提升口岸药品监管和检验检测能力。完善临床急需进口药品、医疗器械使用及监督管理制度,探索将国际新药临床真实世界数据用于进口药品注册上...

2025-06-10 22:13

药明生物启动建设成都微生物商业化生产基地 达成多项商业化生产合作资讯

药明生物启动建设成都微生物商业化生产基地 达成多项商业化生产合作

药明生物在成都温江区正式启动建设微生物商业化生产基地。

2025-06-10 14:29

默克治疗腱鞘巨细胞瘤的药物匹米替尼上市许可申请获受理资讯

默克治疗腱鞘巨细胞瘤的药物匹米替尼上市许可申请获受理

基于III期MANEUVER研究的阳性数据,这是Pimicotinib这一潜在“同类最优”TGCT治疗药物的全球首个申报

2025-06-10 14:25