华大基因CEO王俊:破解基因大数据可实现精准医疗

医疗健康 来源:腾讯科技 作者:刘亚澜
2015
04/22
14:22
腾讯科技
作者:刘亚澜
医疗健康

4月21日,由中国企业家俱乐部主办的2015年中国绿公司年会在沈阳举行。华大基因CEO王俊出席大会,并作了题为“基因、大数据与人工智能”的演讲。

王俊从基因的存储原理、基因测试大数据和人工智能深度学习等角度说明了保持健康,应该不是一个感性的意愿,更重要的是理性选择,这种理性选择是基于数据基础之上,基于人工智能的判断,是对基因的了解基础上形成的。

他将基因组比喻为一个个程序,每个基因是程序运行的一个功能模块。因为一个基因所能完成的只是一个功能,只有将众多基因联合起来才能寻找到不同的生存策略。而优质基因的存储对于医学、美容等都有深刻意义。同时他还提到目前基因大数据的情况,虽然目前成本很高,但他有信心未来基因数据的价值会远大于产生基因数据的成本,到那时,测序就会免费了。

王俊说:“基因蕴藏着所有生老病死的规律,如果从基因谈健康,必须要学会对人的基本状况的预测及预防,而不是简单治疗。”精准医疗对于医疗行业有非常大的改变,其概念核心点把人群细分,对其治疗、诊断要精准,对其个体化的行为和数据要有非常精准的解读,以给出一个精准的、对应化的解决方案。

以下为王俊演讲实录精编:

很高兴在讲基因的相关事情,我改了一下我这个题目,原来讲基因改变世界,我改了一下题目,把它变成BGI,华大基因的缩小是BGI,给一个新的诠释,华大要做三件事,第一件事就是B,做大数据,G是做基因,I是做人工智能。

基因

先从G基因讲起。生命本身是数据化的,我们可能习惯了以硅为基础的,忘记了以碳为基础的生命运营规则,大家可能很难想象,为什么这个生命体本身也是一种计算,为什么本身也是数字化的。

如果把全世界所有的图书,我们看见的书,都用DNA的方式来存储,可以存在巴掌大小的DNA里面,所有的全世界图书管理的书,都可以放在巴掌大小的DNA里面,可以存储多少年呢?上千万年。任何一个现在的计算机,无论光盘还是硬盘介质都不可以,但现在DNA可以存储上千万年,是自然界里面最高效的最持久的存储形式。

让我们假想整个宇宙是一个大的计算机,我们每个人,每个个体只不过是在那儿运行的一个程序。我们所说的基因组,是一个完整的程序,每个基因是程序运行的一个功能模块,就像写计算机一样,写一个功能模块,这一个代码是为了执行一个功能。

再往前追溯的时候,有一本书叫《自私的基因》,追溯在最原始的十几亿年前,在原始汤的形态存在的时候,基因是以分子形式存在,这些东西要不断扩张自己。如果写出一段好的代码,会经常把这段代码用到不同的程序体系里。为什么用到不同程序,因为它好,这边要用到,那边也要用到。一个基因本身最重要的事情就是不断扩张自己。

而如果说基因本身是自私的,在往前走的时候就会发现可能需要合作。因为一个基因所能完成的只是一个功能,如果把两个基因合起来,三个基因合起来,五个基因合起来,一堆基因合起来,就可能寻找到不同的生存策略。

我们现在看见的大千世界,每个物种,事实上是各种基因的不同组合,或者反过来讲,是这些基因的组合所采取的不同的生存策略。这种生存策略是不是成功,它的判定的唯一标准就是环境,你如果适应环境,你就会有更多的机会传播后代。你有更多的机会传播后代,你的基因就得到扩张,在所谓的基因池里面就不断增加你的份额。

你的基因的一半来自于父亲,基因的另外一半来自于母亲,除了父母之间的重组交换之外,因为这个东西本来不同的组合会产生不同的个体,还有一个非常重要的东西,就是除了父母之间的重组交换,在每一代里面,这个孩子跟父母之间会有60到100个基因突变,很多人都不知道这60到100个基因突变里面到底是一些什么东西。

以肿瘤细胞为例,肿瘤细胞就像是写程序的黑客一样,只要他写变了,这个程序变成不断扩张,它的适应性比其他细胞都要强,所以他不断的往前走变成了肿瘤。我们去看最后一个肿瘤细胞,其实如果你不断往前追溯,你都可以追溯到受精卵细胞,也就是说,你的生命的起源。个体生命起源就是一个细胞——受精卵细胞,受精卵细胞在不断进行分化和变成一代一代的时候,都会累计各种各样不同的突变。

大数据

生命科学已经不再像以前在简单的在实验室里面做实验,或者是观察科学。从基因开始一直到表型,是一个巨大的海量数据的输入,这些数据的输入需要起码做到一百万人,比如身高,对身高基因的判断,身高显然是遗产,在营养均衡的情况下,显然是遗传,到底跟哪个基因有关系,现在不清楚,需要多少人弄清楚,需要一百万人,如果一百万的基因数据和他的身高数据,我们可以很准确的把他身高给预测出来。

测一百万人要花多少钱呢?我们在1999年做第一个人类基因组计划的时候,花了10亿美金,测一个人的基因图谱序列,2007年测定一个亚洲人基因图谱序列的时候花了三千万人民币。我们在今年6月份,因为我们自己的知识产权,我们可以做到三千块钱人民币,三千块钱可以把一个人的完整基因全部读出来,这个数字还会往下降,降到什么时候可以不要钱呢?五年?三年?还是今年就可以不要钱?事实上真正所谓这件事情的拐点,是在于我们如何能够转化这个数据本身的价值。如果这个数据的价值远大于产生这个数据的成本,测序就会不要钱了。

除了基因的数据之外,还要收集很多别的数据,比如说物联网数据。把所有的这些数据全部都搁在一起,和你基因合在一起的时候,我们才能得到更多答案。而且数据的可视化会成为很大的问题,这些数据都是呈EB级别的数据,怎么让老百姓看懂是非常大的问题,最终还需把基因数据全部连成网络。

人工智能

最后一个可以讲的就是人工智能,我们做了一个尝试,小米是中国饭桌上最常见的食物之一,我们做了几千株的小米,小米有各种各样刚才我讲的大型数据,用人工智能的方法训练,先把所有大数据收集,做人工智能的深度学习,最后到一种什么准确性,可以到任何一株小米。我测一下它的基因,可以准确猜出在这片地里面它长出来什么样,准确性可以达到90%。

一个孩子刚出生的时候,把脐带、胎盘各种各样干细胞存起来,那时候是最好的程序运行的状态,那些可以用来做各种各样的东西,可以用来修复干细胞,修复神经细胞,肌肉细胞,白血病各种各样的东西。

有人说皮肤干细胞保存,岁数大了,也没脐带血了,胎盘也早没了,这个时候还能不能存?越年轻的时候存越好,因为存的细胞是那个时候生命体信息,比如皮肤,皮肤细胞可以用于美容。

脂肪干细胞存起来以后,可以开始我们叫为生命保驾护航了,干细胞的注射、抗衰老,很多东西,抗衰老就是在你老年的时候,运行一个年轻程序,就抗衰老了。

保持健康,应该不是一个感性的意愿,更重要的是理性选择,这种理性选择是基于数据基础之上,基于人工智能的判断,是对基因的了解基础上形成的。

来源:腾讯科技   作者:刘亚澜

为你推荐

降 HbA1c 超 2.5%且多重获益,华东医药国产降糖新药HDM1005降糖2期数据揭晓资讯

降 HbA1c 超 2.5%且多重获益,华东医药国产降糖新药HDM1005降糖2期数据揭晓

本次研究为一项在饮食和运动或二甲双胍治疗后血糖控制不佳的2型糖尿病受试者中评价HDM1005注射液有效性和安全性的多中心、随机、盲法、平行、安慰剂和阳性对照的Ⅱ期临床研究

2026-03-10 19:38

维适平®中国大陆首张处方落地,为中重度溃疡性结肠炎患者开启治疗新篇章资讯

维适平®中国大陆首张处方落地,为中重度溃疡性结肠炎患者开启治疗新篇章

标志着这款溃疡性结肠炎(UC)首个且唯一口服S1P受体调节剂正式进入中国临床应用阶段

2026-03-10 18:26

艾凯生物完成A3轮超亿元融资,加速AI驱动iPSC细胞治疗与类器官平台升级资讯

艾凯生物完成A3轮超亿元融资,加速AI驱动iPSC细胞治疗与类器官平台升级

本轮融资由知壹投资与沃杰资本联合领投,联新资本持续追加投资,资金将重点用于推进AI驱动的iPSC细胞治疗产品临床转化,加速完善iPSC细胞治疗与类器官两大核心技术平台布局。

2026-03-10 18:22

中科搏锐斩获数千万B轮融资,推动脑机接口全产业链产业化落地资讯

中科搏锐斩获数千万B轮融资,推动脑机接口全产业链产业化落地

本轮融资由国内知名投资机构三泽创投独家投资,凯乘资本担任长期独家财务顾问,所筹资金将全力支撑公司深化脑机接口全产业链布局,加速尖端技术的临床转化与产业化落地。

2026-03-10 18:03

第102批仿制药参比制剂目录资讯

第102批仿制药参比制剂目录

经国家药品监督管理局仿制药质量和疗效一致性评价专家委员会审核确定,现发布仿制药参比制剂目录(第一百零二批)。

2026-03-10 17:02

康方生物全球首创三抗获批临床试验资讯

康方生物全球首创三抗获批临床试验

3月9日,据CDE官网临床默示许可显示,康方生物(09926 HK)自主研发的注射用AK150正式获批临床,适应症为晚期实体瘤。

2026-03-10 16:16

入选不足4月,和黄医药申请将达唯珂移出首版商保创新药目录资讯

入选不足4月,和黄医药申请将达唯珂移出首版商保创新药目录

国家医疗保障局办公室今日发布通知,自2026年3月9日起,撤销氢溴酸他泽司他片(商品名:达唯珂)在全国各省级医药采购平台挂网资格,并根据企业申请,将该药品移出《商业健康保...

2026-03-09 22:09

港股通调入13家医药健康企业,调出5家资讯

港股通调入13家医药健康企业,调出5家

近日,上海证券交易所官网发布最新港股通标调整通知,共42家企业被调入港股通,其中生物医药、医疗健康企业调入13家。

2026-03-08 19:19

CDE:抗肿瘤药物生物等效性及药代动力学比对研究受试者人群选择考虑资讯

CDE:抗肿瘤药物生物等效性及药代动力学比对研究受试者人群选择考虑

本指导原则主要基于小分子化学药物及单抗类药物的研究经验,为抗肿瘤药物 BE PK 比对研究中受试者人群的选择考虑提供建议。

2026-03-07 10:59

四家知名药企被暂停军队采购资讯

四家知名药企被暂停军队采购

近日,军队采购网发布一批“军队采购暂停名单”,其中涉及四家药企被列入暂停名单,具体为北京费森尤斯卡比医药有限公司、齐鲁制药有限公司、宜昌人福药业有限责任公司和江苏新...

2026-03-07 10:41

全球首个基础胰岛素/GLP-1RA周制剂诺和杰在中国获批资讯

全球首个基础胰岛素/GLP-1RA周制剂诺和杰在中国获批

诺和杰此次在中国获批,使中国成为该药品全球首个商业上市的国家。

2026-03-06 18:03

中科易微完成Pre-A轮融资,全力推进先进外泌体抗衰产品研发与产业化落地资讯

中科易微完成Pre-A轮融资,全力推进先进外泌体抗衰产品研发与产业化落地

本轮融资由长春长兴基金独家战略投资

2026-03-06 15:03

赛核生物完成数千万天使+轮融资,加速推进创新核药研发和临床试验资讯

赛核生物完成数千万天使+轮融资,加速推进创新核药研发和临床试验

本轮融资由老股东冷杉溪资本领投,隆泰投资跟投

2026-03-06 14:45

新一代 cAMP 偏向型 GLP-1 受体激动剂埃诺格鲁肽(先维盈)获批用于中国成人体重管理资讯

新一代 cAMP 偏向型 GLP-1 受体激动剂埃诺格鲁肽(先维盈)获批用于中国成人体重管理

在一项大型III期临床研究中展现出具有临床意义的减重效果:治疗48周时,受试者的平均体重下降达15 4%,其中92 8%的受试者实现了5%以上的体重减轻。

2026-03-06 12:38

新型长效胰淀素受体激动剂获批中国临床资讯

新型长效胰淀素受体激动剂获批中国临床

Eloralintide 3 项全球关键 Ⅲ 期临床研究同步中国开展

2026-03-05 11:09

11.8亿美元!德琪医药自免TCE双抗ATG-201授权优时比资讯

11.8亿美元!德琪医药自免TCE双抗ATG-201授权优时比

德琪医药将其自主研发的CD19 CD3双特异性T细胞连接抗体(TCE)ATG-201的全球开发、生产及商业化独家权益授予优时比,用于治疗B细胞相关自身免疫性疾病。

2026-03-04 20:05

产品创新中的专利战略资讯

产品创新中的专利战略

专利作为制约竞争对手设计相同或类似产品的壁垒,成为保护创新的良好手段。

文/英国IDC总部董事总经理Stephen Knowles博士 2026-03-04 15:38

君实生物被调出科创50资讯

君实生物被调出科创50

近日,上海证券交易所,中证指数有限公司联合发布《关于科创50等指数一季度定期调整结果的公告》,本次调整,调入3家,调出3家,其中君实生物被调出科创50指数,此次调整将于202...

2026-03-04 15:30

吉利德比克替拉韦与来那帕韦单片治疗方案在更换抗反转录病毒治疗药物的 HIV 感染者中维持病毒学抑制资讯

吉利德比克替拉韦与来那帕韦单片治疗方案在更换抗反转录病毒治疗药物的 HIV 感染者中维持病毒学抑制

新型在研药物组合将全球指南推荐、具有高耐药屏障的整合酶链转移抑制剂比克替拉韦,与同类首创衣壳抑制剂来那帕韦相结合

2026-03-04 13:41

全球首创便携式宫颈无创光动力治疗药物希维她在华获批资讯

全球首创便携式宫颈无创光动力治疗药物希维她在华获批

CIN2的治疗决策一直是妇科宫颈上皮内病变治疗临床实践中的核心挑战,宫颈环形电切术(LEEP)等切除性手术虽为临床常用的治疗方案,但其可能导致宫颈结构改变、宫颈机能不全,进...

2026-03-04 13:32