华大基因CEO王俊:破解基因大数据可实现精准医疗

医疗健康 来源:腾讯科技 作者:刘亚澜
2015
04/22
14:22
腾讯科技
作者:刘亚澜
医疗健康

4月21日,由中国企业家俱乐部主办的2015年中国绿公司年会在沈阳举行。华大基因CEO王俊出席大会,并作了题为“基因、大数据与人工智能”的演讲。

王俊从基因的存储原理、基因测试大数据和人工智能深度学习等角度说明了保持健康,应该不是一个感性的意愿,更重要的是理性选择,这种理性选择是基于数据基础之上,基于人工智能的判断,是对基因的了解基础上形成的。

他将基因组比喻为一个个程序,每个基因是程序运行的一个功能模块。因为一个基因所能完成的只是一个功能,只有将众多基因联合起来才能寻找到不同的生存策略。而优质基因的存储对于医学、美容等都有深刻意义。同时他还提到目前基因大数据的情况,虽然目前成本很高,但他有信心未来基因数据的价值会远大于产生基因数据的成本,到那时,测序就会免费了。

王俊说:“基因蕴藏着所有生老病死的规律,如果从基因谈健康,必须要学会对人的基本状况的预测及预防,而不是简单治疗。”精准医疗对于医疗行业有非常大的改变,其概念核心点把人群细分,对其治疗、诊断要精准,对其个体化的行为和数据要有非常精准的解读,以给出一个精准的、对应化的解决方案。

以下为王俊演讲实录精编:

很高兴在讲基因的相关事情,我改了一下我这个题目,原来讲基因改变世界,我改了一下题目,把它变成BGI,华大基因的缩小是BGI,给一个新的诠释,华大要做三件事,第一件事就是B,做大数据,G是做基因,I是做人工智能。

基因

先从G基因讲起。生命本身是数据化的,我们可能习惯了以硅为基础的,忘记了以碳为基础的生命运营规则,大家可能很难想象,为什么这个生命体本身也是一种计算,为什么本身也是数字化的。

如果把全世界所有的图书,我们看见的书,都用DNA的方式来存储,可以存在巴掌大小的DNA里面,所有的全世界图书管理的书,都可以放在巴掌大小的DNA里面,可以存储多少年呢?上千万年。任何一个现在的计算机,无论光盘还是硬盘介质都不可以,但现在DNA可以存储上千万年,是自然界里面最高效的最持久的存储形式。

让我们假想整个宇宙是一个大的计算机,我们每个人,每个个体只不过是在那儿运行的一个程序。我们所说的基因组,是一个完整的程序,每个基因是程序运行的一个功能模块,就像写计算机一样,写一个功能模块,这一个代码是为了执行一个功能。

再往前追溯的时候,有一本书叫《自私的基因》,追溯在最原始的十几亿年前,在原始汤的形态存在的时候,基因是以分子形式存在,这些东西要不断扩张自己。如果写出一段好的代码,会经常把这段代码用到不同的程序体系里。为什么用到不同程序,因为它好,这边要用到,那边也要用到。一个基因本身最重要的事情就是不断扩张自己。

而如果说基因本身是自私的,在往前走的时候就会发现可能需要合作。因为一个基因所能完成的只是一个功能,如果把两个基因合起来,三个基因合起来,五个基因合起来,一堆基因合起来,就可能寻找到不同的生存策略。

我们现在看见的大千世界,每个物种,事实上是各种基因的不同组合,或者反过来讲,是这些基因的组合所采取的不同的生存策略。这种生存策略是不是成功,它的判定的唯一标准就是环境,你如果适应环境,你就会有更多的机会传播后代。你有更多的机会传播后代,你的基因就得到扩张,在所谓的基因池里面就不断增加你的份额。

你的基因的一半来自于父亲,基因的另外一半来自于母亲,除了父母之间的重组交换之外,因为这个东西本来不同的组合会产生不同的个体,还有一个非常重要的东西,就是除了父母之间的重组交换,在每一代里面,这个孩子跟父母之间会有60到100个基因突变,很多人都不知道这60到100个基因突变里面到底是一些什么东西。

以肿瘤细胞为例,肿瘤细胞就像是写程序的黑客一样,只要他写变了,这个程序变成不断扩张,它的适应性比其他细胞都要强,所以他不断的往前走变成了肿瘤。我们去看最后一个肿瘤细胞,其实如果你不断往前追溯,你都可以追溯到受精卵细胞,也就是说,你的生命的起源。个体生命起源就是一个细胞——受精卵细胞,受精卵细胞在不断进行分化和变成一代一代的时候,都会累计各种各样不同的突变。

大数据

生命科学已经不再像以前在简单的在实验室里面做实验,或者是观察科学。从基因开始一直到表型,是一个巨大的海量数据的输入,这些数据的输入需要起码做到一百万人,比如身高,对身高基因的判断,身高显然是遗产,在营养均衡的情况下,显然是遗传,到底跟哪个基因有关系,现在不清楚,需要多少人弄清楚,需要一百万人,如果一百万的基因数据和他的身高数据,我们可以很准确的把他身高给预测出来。

测一百万人要花多少钱呢?我们在1999年做第一个人类基因组计划的时候,花了10亿美金,测一个人的基因图谱序列,2007年测定一个亚洲人基因图谱序列的时候花了三千万人民币。我们在今年6月份,因为我们自己的知识产权,我们可以做到三千块钱人民币,三千块钱可以把一个人的完整基因全部读出来,这个数字还会往下降,降到什么时候可以不要钱呢?五年?三年?还是今年就可以不要钱?事实上真正所谓这件事情的拐点,是在于我们如何能够转化这个数据本身的价值。如果这个数据的价值远大于产生这个数据的成本,测序就会不要钱了。

除了基因的数据之外,还要收集很多别的数据,比如说物联网数据。把所有的这些数据全部都搁在一起,和你基因合在一起的时候,我们才能得到更多答案。而且数据的可视化会成为很大的问题,这些数据都是呈EB级别的数据,怎么让老百姓看懂是非常大的问题,最终还需把基因数据全部连成网络。

人工智能

最后一个可以讲的就是人工智能,我们做了一个尝试,小米是中国饭桌上最常见的食物之一,我们做了几千株的小米,小米有各种各样刚才我讲的大型数据,用人工智能的方法训练,先把所有大数据收集,做人工智能的深度学习,最后到一种什么准确性,可以到任何一株小米。我测一下它的基因,可以准确猜出在这片地里面它长出来什么样,准确性可以达到90%。

一个孩子刚出生的时候,把脐带、胎盘各种各样干细胞存起来,那时候是最好的程序运行的状态,那些可以用来做各种各样的东西,可以用来修复干细胞,修复神经细胞,肌肉细胞,白血病各种各样的东西。

有人说皮肤干细胞保存,岁数大了,也没脐带血了,胎盘也早没了,这个时候还能不能存?越年轻的时候存越好,因为存的细胞是那个时候生命体信息,比如皮肤,皮肤细胞可以用于美容。

脂肪干细胞存起来以后,可以开始我们叫为生命保驾护航了,干细胞的注射、抗衰老,很多东西,抗衰老就是在你老年的时候,运行一个年轻程序,就抗衰老了。

保持健康,应该不是一个感性的意愿,更重要的是理性选择,这种理性选择是基于数据基础之上,基于人工智能的判断,是对基因的了解基础上形成的。

来源:腾讯科技   作者:刘亚澜

为你推荐

蔡磊发布致渐冻症病友的新年公开信:历史已被改写,渐冻症必然被攻克,为了生命,决不投降资讯

蔡磊发布致渐冻症病友的新年公开信:历史已被改写,渐冻症必然被攻克,为了生命,决不投降

2026年1月1日,蔡磊发布新年公开信,题为历史已被改写,渐冻症必然被攻克。

2026-01-02 10:48

辅酶Q10和褪黑素备案产品可用剂型增加,并增加新的辅料资讯

辅酶Q10和褪黑素备案产品可用剂型增加,并增加新的辅料

12月31日,市场监管总局发布《辅酶Q10和褪黑素保健食品原料备案产品增补剂型和辅料》的公告。

2025-12-31 17:12

长效生长激素大幅降价资讯

长效生长激素大幅降价

12月7日,国家医保局正式发布《国家基本医疗保险、生育保险和工伤保险药品目录(2025年)》,长效生长激素特宝生物的怡培生长激素注射液(益佩生)和金赛药业的金培生长激素注射...

2025-12-31 14:32

罗永浩自曝患ADHD多年资讯

罗永浩自曝患ADHD多年

12月31日凌晨,罗永浩发布微博回应科技春晚迟到 40 分钟,称因为 ADHD(注意缺陷与多动障碍)的关系,发布会没有一场是彩排过的,全是没有彩排直接上去硬讲。幻灯片从来没有...

2025-12-31 11:12

北京市医疗健康领域支持人工智能产业创新发展若干措施(2026-2027年)资讯

北京市医疗健康领域支持人工智能产业创新发展若干措施(2026-2027年)

建立人工智能医疗伦理审查制度,加强算法透明性和患者隐私保护监管;联合药监部门探索“监管沙盒”机制,为创新产品提供容错空间,确保产业安全有序发展。

2025-12-31 10:46

上海扩大服务消费,应用细胞治疗、脑机接口等先进治疗手段,推进创新技术、创新药械临床使用资讯

上海扩大服务消费,应用细胞治疗、脑机接口等先进治疗手段,推进创新技术、创新药械临床使用

上海市商务委员会等16部门印发《关于进一步扩大上海服务消费的若干措施》。

2025-12-31 10:39

英矽智能在港交所正式上市资讯

英矽智能在港交所正式上市

12月30日,AI制药公司英矽智能在港交所正式上市,

2025-12-30 15:35

全球首款口服胰岛素上市申请未获成功资讯

全球首款口服胰岛素上市申请未获成功

12月29日,国家药监局公布药品通知件送达信息,合肥天汇生物科技有限公司申报的重组人胰岛素肠溶胶囊位列其中。一般而言,拿到药品通知件,有可能是药品上市申请“不予批准”,...

2025-12-30 11:20

北大人民医院牵头发布首个外科领域“AI医生”应用标准资讯

北大人民医院牵头发布首个外科领域“AI医生”应用标准

12月29日,北京大学人民医院与蚂蚁健康联合组建的“医学人工智能创新联合研究中心”正式揭牌成立。

2025-12-30 10:40

远大医药优敏速获批,成为中国唯一严重过敏院外急救肾上腺素鼻喷剂资讯

远大医药优敏速获批,成为中国唯一严重过敏院外急救肾上腺素鼻喷剂

远大医药(0512 HK)发布公告,公司近期布局的全球首款用于紧急治疗I型过敏反应(包括严重过敏反应)的肾上腺素鼻喷雾剂Neffy®(优敏速®)已获国家药监局颁发药品注册证书。

2025-12-29 19:03

中华人民共和国危险化学品安全法,2026年5月1日起施行资讯

中华人民共和国危险化学品安全法,2026年5月1日起施行

2025年12月27日第十四届全国人民代表大会常务委员会第十九次会议通过。

2025-12-29 16:54

首个国产CTLA-4单抗获批资讯

首个国产CTLA-4单抗获批

近日,信达生物发布公告,宣布达伯欣(伊匹木单抗N01注射液,细胞毒性T淋巴细胞相关蛋白4(CTLA-4)单抗,研发代号:IBI310)获得中国国家药品监督管理局(NMPA)批准上市。

2025-12-29 16:30

我国首个核医疗示范基地在苏州启用资讯

我国首个核医疗示范基地在苏州启用

12月27日,我国首个核医疗示范基地,在苏州大学附属第二医院(核工业总医院)浒关院区正式建成启用。

2025-12-29 11:32

AI健康应用“蚂蚁阿福”今日发布声明:健康问答结果中没有广告,也不存在商业排名资讯

AI健康应用“蚂蚁阿福”今日发布声明:健康问答结果中没有广告,也不存在商业排名

今日,AI健康应用“蚂蚁阿福”发布官方声明,明确表示,阿福的问答结果中没有任何广告推荐、不存在商业排名,也不受其他商业因素干扰,用户可以放心使用。

2025-12-29 11:13

脑机接口等8款产品纳入优先审批高端医疗器械目录(2025版)资讯

脑机接口等8款产品纳入优先审批高端医疗器械目录(2025版)

​12月26日,国家药监局发布优先审批高端医疗器械目录(2025版)。

2025-12-27 21:39

优赫得在华获批为首个用于既往在转移性疾病阶段经一种或一种以上内分泌治疗进展的HER2低表达或超低表达乳腺癌患者的HER2靶向疗法资讯

优赫得在华获批为首个用于既往在转移性疾病阶段经一种或一种以上内分泌治疗进展的HER2低表达或超低表达乳腺癌患者的HER2靶向疗法

基于DESTINY-Breast06 III期试验结果:德曲妥珠单抗相较化疗展现出显著优势,中位无进展生存期超过一年

2025-12-26 17:12

ADC 创新药新锐翎泰天润完成近亿元 Pre-A 轮融资,加速自免与肿瘤领域临床突破资讯

ADC 创新药新锐翎泰天润完成近亿元 Pre-A 轮融资,加速自免与肿瘤领域临床突破

本轮融资由磐霖资本与杏泽资本联合领投,天使轮股东骊宸元鼎、联想之星持续加注,资金将重点用于核心产品 2026 年临床试验推进及多适应症管线布局拓展。

2025-12-26 17:08

血霁生物完成过亿元B1轮股权融资首关和过亿元债权融资资讯

血霁生物完成过亿元B1轮股权融资首关和过亿元债权融资

本轮融资将加速推进其核心管线临床试验与全球化布局,为解决临床血源短缺、血液传播疾病等痛点注入强劲动力,标志着中国体外造血技术商业化进入关键阶段。

2025-12-26 17:03

浙江将首版商保创新药目录19个品种全部纳入“双通道”范围资讯

浙江将首版商保创新药目录19个品种全部纳入“双通道”范围

12月25日,浙江省医保局发布2026年该省纳入“双通道”管理药品名单,除最新国谈药品及2025年纳入“双通道”药品调整外,浙江将首次商保创新药目录中的19个药品全部纳入。

2025-12-26 14:33

自2026年5月1日起施行,《医疗器械出口销售证明管理规定》发布资讯

自2026年5月1日起施行,《医疗器械出口销售证明管理规定》发布

本规定自2026年5月1日起施行。2015年6月1日原国家食品药品监督管理总局《关于发布医疗器械产品出口销售证明管理规定的通告》(2015年第18号)同时废止。

2025-12-26 13:45