4月21日,由中国企业家俱乐部主办的2015年中国绿公司年会在沈阳举行。华大基因CEO王俊出席大会,并作了题为“基因、大数据与人工智能”的演讲。
王俊从基因的存储原理、基因测试大数据和人工智能深度学习等角度说明了保持健康,应该不是一个感性的意愿,更重要的是理性选择,这种理性选择是基于数据基础之上,基于人工智能的判断,是对基因的了解基础上形成的。
他将基因组比喻为一个个程序,每个基因是程序运行的一个功能模块。因为一个基因所能完成的只是一个功能,只有将众多基因联合起来才能寻找到不同的生存策略。而优质基因的存储对于医学、美容等都有深刻意义。同时他还提到目前基因大数据的情况,虽然目前成本很高,但他有信心未来基因数据的价值会远大于产生基因数据的成本,到那时,测序就会免费了。
王俊说:“基因蕴藏着所有生老病死的规律,如果从基因谈健康,必须要学会对人的基本状况的预测及预防,而不是简单治疗。”精准医疗对于医疗行业有非常大的改变,其概念核心点把人群细分,对其治疗、诊断要精准,对其个体化的行为和数据要有非常精准的解读,以给出一个精准的、对应化的解决方案。
以下为王俊演讲实录精编:
很高兴在讲基因的相关事情,我改了一下我这个题目,原来讲基因改变世界,我改了一下题目,把它变成BGI,华大基因的缩小是BGI,给一个新的诠释,华大要做三件事,第一件事就是B,做大数据,G是做基因,I是做人工智能。
基因
先从G基因讲起。生命本身是数据化的,我们可能习惯了以硅为基础的,忘记了以碳为基础的生命运营规则,大家可能很难想象,为什么这个生命体本身也是一种计算,为什么本身也是数字化的。
如果把全世界所有的图书,我们看见的书,都用DNA的方式来存储,可以存在巴掌大小的DNA里面,所有的全世界图书管理的书,都可以放在巴掌大小的DNA里面,可以存储多少年呢?上千万年。任何一个现在的计算机,无论光盘还是硬盘介质都不可以,但现在DNA可以存储上千万年,是自然界里面最高效的最持久的存储形式。
让我们假想整个宇宙是一个大的计算机,我们每个人,每个个体只不过是在那儿运行的一个程序。我们所说的基因组,是一个完整的程序,每个基因是程序运行的一个功能模块,就像写计算机一样,写一个功能模块,这一个代码是为了执行一个功能。
再往前追溯的时候,有一本书叫《自私的基因》,追溯在最原始的十几亿年前,在原始汤的形态存在的时候,基因是以分子形式存在,这些东西要不断扩张自己。如果写出一段好的代码,会经常把这段代码用到不同的程序体系里。为什么用到不同程序,因为它好,这边要用到,那边也要用到。一个基因本身最重要的事情就是不断扩张自己。
而如果说基因本身是自私的,在往前走的时候就会发现可能需要合作。因为一个基因所能完成的只是一个功能,如果把两个基因合起来,三个基因合起来,五个基因合起来,一堆基因合起来,就可能寻找到不同的生存策略。
我们现在看见的大千世界,每个物种,事实上是各种基因的不同组合,或者反过来讲,是这些基因的组合所采取的不同的生存策略。这种生存策略是不是成功,它的判定的唯一标准就是环境,你如果适应环境,你就会有更多的机会传播后代。你有更多的机会传播后代,你的基因就得到扩张,在所谓的基因池里面就不断增加你的份额。
你的基因的一半来自于父亲,基因的另外一半来自于母亲,除了父母之间的重组交换之外,因为这个东西本来不同的组合会产生不同的个体,还有一个非常重要的东西,就是除了父母之间的重组交换,在每一代里面,这个孩子跟父母之间会有60到100个基因突变,很多人都不知道这60到100个基因突变里面到底是一些什么东西。
以肿瘤细胞为例,肿瘤细胞就像是写程序的黑客一样,只要他写变了,这个程序变成不断扩张,它的适应性比其他细胞都要强,所以他不断的往前走变成了肿瘤。我们去看最后一个肿瘤细胞,其实如果你不断往前追溯,你都可以追溯到受精卵细胞,也就是说,你的生命的起源。个体生命起源就是一个细胞——受精卵细胞,受精卵细胞在不断进行分化和变成一代一代的时候,都会累计各种各样不同的突变。
大数据
生命科学已经不再像以前在简单的在实验室里面做实验,或者是观察科学。从基因开始一直到表型,是一个巨大的海量数据的输入,这些数据的输入需要起码做到一百万人,比如身高,对身高基因的判断,身高显然是遗产,在营养均衡的情况下,显然是遗传,到底跟哪个基因有关系,现在不清楚,需要多少人弄清楚,需要一百万人,如果一百万的基因数据和他的身高数据,我们可以很准确的把他身高给预测出来。
测一百万人要花多少钱呢?我们在1999年做第一个人类基因组计划的时候,花了10亿美金,测一个人的基因图谱序列,2007年测定一个亚洲人基因图谱序列的时候花了三千万人民币。我们在今年6月份,因为我们自己的知识产权,我们可以做到三千块钱人民币,三千块钱可以把一个人的完整基因全部读出来,这个数字还会往下降,降到什么时候可以不要钱呢?五年?三年?还是今年就可以不要钱?事实上真正所谓这件事情的拐点,是在于我们如何能够转化这个数据本身的价值。如果这个数据的价值远大于产生这个数据的成本,测序就会不要钱了。
除了基因的数据之外,还要收集很多别的数据,比如说物联网数据。把所有的这些数据全部都搁在一起,和你基因合在一起的时候,我们才能得到更多答案。而且数据的可视化会成为很大的问题,这些数据都是呈EB级别的数据,怎么让老百姓看懂是非常大的问题,最终还需把基因数据全部连成网络。
人工智能
最后一个可以讲的就是人工智能,我们做了一个尝试,小米是中国饭桌上最常见的食物之一,我们做了几千株的小米,小米有各种各样刚才我讲的大型数据,用人工智能的方法训练,先把所有大数据收集,做人工智能的深度学习,最后到一种什么准确性,可以到任何一株小米。我测一下它的基因,可以准确猜出在这片地里面它长出来什么样,准确性可以达到90%。
一个孩子刚出生的时候,把脐带、胎盘各种各样干细胞存起来,那时候是最好的程序运行的状态,那些可以用来做各种各样的东西,可以用来修复干细胞,修复神经细胞,肌肉细胞,白血病各种各样的东西。
有人说皮肤干细胞保存,岁数大了,也没脐带血了,胎盘也早没了,这个时候还能不能存?越年轻的时候存越好,因为存的细胞是那个时候生命体信息,比如皮肤,皮肤细胞可以用于美容。
脂肪干细胞存起来以后,可以开始我们叫为生命保驾护航了,干细胞的注射、抗衰老,很多东西,抗衰老就是在你老年的时候,运行一个年轻程序,就抗衰老了。
保持健康,应该不是一个感性的意愿,更重要的是理性选择,这种理性选择是基于数据基础之上,基于人工智能的判断,是对基因的了解基础上形成的。
来源:腾讯科技 作者:刘亚澜
为你推荐
资讯 药品附条件批准上市申请审评审批工作程序
附条件批准时,每个附条件批准的适应症单独设置药品注册证书有效期,原则上,在确证性研究完成时限的基础上增加一年。确证性研究完成时限由药审中心在审评中与申请人沟通交流后...
2026-04-26 10:58
资讯 CDE:抗体偶联药物首次申报临床试验药学资料撰写指导原则
本指导原则基于 ICH M4Q( R1)总体框架, 格式体例与之保持一致, 在其框架下结合抗体偶联药物的药学研究特点,细化了 IND 申报药学资料的撰写要求,旨在为该类药物 IN...
2026-04-25 21:39
资讯 蚂蚁健康向医院开放“智慧医疗AI一体化方案” 支持智能体、云陪诊、本地化模型部署
4月25日,在2026中国医院信息网络大会(CHIMA 2026)上,蚂蚁健康面向全国医院及医疗机构推出“智慧医疗AI一体化方案”。
2026-04-25 20:09
资讯 美敦力 5.5 亿美元收购 Scientia Vascular,加码神经血管赛道布局
Scientia Vascular 是专注于神经血管创新器械研发的新兴企业,核心产品管线聚焦颅内血管病变介入治疗领域
2026-04-25 15:50
资讯 聚焦预防接种全龄升级,多方合力开展“成人全周期免疫促进暨带状疱疹公益科普”
4月25日,国家疾病预防控制局在上海举办主题宣传活动,呼吁“预防接种,苗助健康,全民行动”。
2026-04-25 15:41
资讯 超亿元 A 轮融资!奥明星程以 AI4S 定义下一代生物智能基础设施
由深创投与复星医药(复健资本)联合领投,太平股权、广东中医药大健康基金、杭实集团等多家头部投资机构、产业链龙头企业及多地国资跟投。
2026-04-24 18:28
资讯 Cytiva ÄKTA与Biacore系列产品实现本地生产, 以“桐庐样本”赋能生物医药“加速度”
依托桐庐生产基地,Cytiva持续提升本土供应能力,以更短的交付周期与定制化支持,精准匹配中国研发节奏,深度践行“在中国,为中国”承诺
2026-04-24 18:13
资讯 全球首个治疗遗传性耳聋基因疗法获批
4 月 23 日,再生元宣布,美国 FDA 已经加速批准其在研基因疗法Otarmeni(lunsotogene parvec-cwha)上市,该药品成为首个也是目前唯一获批用于治疗遗传性听力损失的基因疗法。
2026-04-24 18:01
资讯 CDE:治疗用重组蛋白药物首次申报临床试验药学资料撰写指导原则
本指导原则基于 ICH M4Q( R1)总体框架, 格式体例与之保持一致, 在其框架下结合治疗用重组蛋白药物的药学研究特点,细化了 IND 申报药学资料的撰写要求,旨在为该类药...
2026-04-24 12:44
资讯 甘李药业GLP-1R博凡格鲁肽Ⅲ期临床试验完成首例受试者给药
4月23日,甘李药业发布公告,博凡格鲁肽(研发代号:GZR18)注射液正在中国开展的适应症成人肥胖患者的中度至重度阻塞性睡眠呼吸暂停(OSA)的Ⅲ期临床试验,于近日成功完成首例...
2026-04-24 10:25
资讯 应世生物再冲港交所 IPO:手握国内唯一 III 期 FAK 抑制剂,专攻肿瘤耐药后市场
公司战略性聚焦黏着斑激酶(FAK)及整合素通路,这些靶点对肿瘤细胞的顽强生存能力至关重要。
2026-04-23 22:00
资讯 华东医药2025年创新收入大增64.2%,2026Q1扣非净利创单季历史新高
2026年4月23日晚间,华东医药(000963 SZ)发布2025年年度报告及2026年第一季度业绩。
2026-04-23 21:45
资讯 默克与谷歌云达成一项10亿美元的AI合作
此次合作,默克期望将自身在药物研发、科学管理、市场运营等方面能力与人工智能、云平台相结合,帮助默克全球约7 5万名员工提升生产力。
2026-04-23 13:00
资讯 神经介入与神经外科植入材料等7类医用耗材分类与代码及医保通用名
近日,国家医保局发布《神经介入与神经外科植入材料等7类医用耗材分类与代码及医保通用名》公开征求意见的公告。
2026-04-23 11:29
资讯 真实生物阿兹夫定与哆希替尼联合疗法最新消息
近日,真实生物在美国癌症研究协会(AACR 2026)年会以壁报形式展示了阿兹夫定与哆希替尼联合疗法的临床前研究成果,标题为标题:Azvudine Combined with Doxitinib,a Potential Therapy for EGFRm+ NSCLC。
2026-04-23 11:07






