全球首个百亿级人类基因组基础模型Genos发布

医疗健康 来源:医谷网
2025
10/23
15:54
医谷网 医疗健康

在生命科学的前沿探索中,我们早已能高效“读出”生命的序列,但如何从30亿碱基对中“读懂”生命奥秘,长期以来都是一项巨大挑战,如同在没有地图的荒野中寻找路径。

10月23日,在第二十届国际基因组学大会(ICG-20)上,华大生命科学研究院与之江实验室联合发布了全球首个百亿参数人类基因组通用基础模型——Genos。这一针对人类基因组深度优化的基因组基础模型,可支持高达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。

Genos的推出标志着基因组研究从“读出”碱基序列迈向“读懂”生命底层逻辑的一次关键转折,有望为临床疾病诊断、个人基因组解读及前沿科学研究带来突破性变革。

据悉,Genos的相关成果已发表于国际学术期刊GigaScience。

文章截图(https://doi.org/10.1093/gigascience/giaf132

广度、深度、效率兼具,一款真正具有生产力的基因组大模型

要读懂“生命之书”,首先需要一本完整的“字典”。

基因组学领域内的现有模型大多基于一到两个参考基因组进行训练,难以捕捉人类丰富的遗传多样性。而Genos则系统整合了人类泛基因组参考联盟(HPRC)、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次汇聚了全球范围内636个“端粒到端粒”(T2T)级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,旨在从源头减少数据偏见,更全面地代表人类遗传多样性。

基因组的语言极其复杂,一个微小的单碱基突变,其影响可能由百万碱基之外的“遥远”调控元件决定。这要求模型既要有“显微镜”般的单碱基精度,又要有“广角镜”般的百万级超长上下文理解能力。

如同阅读一部鸿篇巨著,既能一字不差地记住细节,又能洞悉全局的宏大叙事。Genos通过混合专家(Mixture-of-Experts, MoE)架构,巧妙地解决了这一挑战。MoE架构如同一个拥有众多顶尖专家的智慧团队,面对任务时,总能精准调度最相关的几位专家协同处理,而不是调动所有人全部待命。这一“按需激活”的机制,让Genos在拥有百亿级参数的庞大知识总量的同时,推理成本和资源消耗却远低于同等规模的模型,真正实现了“既强大,又好用”。

为了全面验证模型的性能,研发团队进行了一系列测试。在基因组元件识别、远程调控预测、突变致病性预测等经典评测任务里,Genos在超过一半的任务里比所有现有模型都表现更好,而且长序列评测任务里,如突变热点识别和族群分类上,Genos的表现远超同类模型,展现了其强大的上下文分析能力,有效破译基因组中的“暗物质”。

更重要的是,Genos在直接面向临床应用的致病性突变解读任务中,实现了92%的准确性,当结合021科学基础模型后,准确率更是高达98.3%,为临床诊断提供了全新的高效工具。综合多项评测结果,Genos在各项核心任务中的表现均全面超越了现有最佳水平(SOTA),证明了其卓越且全面的能力。

共有、共为、共享,让前沿科技触手可及

一个模型无论多么强大,如果不能被方便地部署和使用,其价值便大打折扣。目前,全球基因组学领域尚无一款能够被开发者和研究者直接部署、用于下游应用的百亿级人类基因组基础大模型。而Genos的发布,则填补了这一空白。它是一个可以走向临床、走向个人、走向每一个实验室的“实践先锋”,为无限的下游应用创新提供了坚实的地基。

今年是人类基因组草图绘制完成25周年。“共有、共为、共享”,既是人类基因组计划的精神传承,也是Genos与生俱来的核心理念。

发布会上,华大生命科学研究院宣布,Genos模型将全面、彻底地开源开放,且同时提供12亿和100亿参数两个版本,满足不同应用场景的需求。目前,两个版本的模型权重、架构细节与完整训练流程,均已在GitHub、Hugging Face、魔搭等平台依据MIT开源协议公开发布,供全球开发者和科研人员自由使用。同时,在之江实验室的开放平台Zero2X也已发布。

另外,考虑到并非所有使用者都拥有强大的算力资源,该模型已被深度整合进DCS Cloud云平台。用户无需进行复杂的安装配置,即可一键调用Genos,平台为每个账户提供了高达10万次的免费推理服务,极大地降低了基因组智能分析的门槛。

目前,在科研领域,Genos模型通过与DCS cloud结合,能仅凭DNA序列“秒级”预测RNA表达谱,将过去数周甚至数月才能完成的生物信息分析流程极大提速。此外,Genos模型也已整合进生命科学数据库CNGBdb,可帮助用户精准预测细胞表达量,高效筛选和验证关键候选基因,大幅加速科研发现。

在临床应用领域,Genos模型与华大已发布的GeneT深度思考模型结合,能为遗传疾病诊断提供专家级的多模态解读。而在个人健康领域,目前Genos模型已整合进BGE平台,将赋能个人基因组报告解读,把复杂的生命代码翻译成每个人都能读懂的、个性化的健康“说明书”。

值得一提的是,Genos的诞生,源自一次大胆的跨界融合与人才培养实践。该模型的核心研发团队,来自华大生命科学研究院与之江实验室联合发起的“大模型种子班”。这个汇聚了生物信息专家与计算科学骨干的精英团队,依托“以问题导向实训、以任务驱动创新”的模式,正推动生命科学研究从“数据挖掘”迈向“智能涌现”的新纪元。也正是这种跨界碰撞,为Genos的颠覆性创新注入了最核心的动力。

此次Genos的发布,标志着一个新时代的开启:一个基因组智能分析的时代,一个人人都能读懂自己生命天书的时代,正加速到来。为持续推动模型迭代,华大生命科学研究院近期还联合国内外多家单位共同发起了“十万长读长大人群联盟(Long100K Genomes Consortium)”和“百亿细胞计划(10BC)”两项大科学计划。其中,“十万长读长大人群联盟”将依托最新的Cyclone长读长测序技术,完成10万人的“端粒到端粒”级别完整基因组测序,为基因组大模型提供高质量的训练数据。而“百亿细胞计划”则将依托Stereo-Cell超高通量细胞组学技术,完成百亿细胞测序,助力基因和细胞的融合大模型开发。从基因组到多组学,一个更强大的生命科学基础模型正在孕育之中。

为你推荐

中国制药装备行业协会副秘书长遆倩鹤涉嫌严重违法,正接受监察调查资讯

中国制药装备行业协会副秘书长遆倩鹤涉嫌严重违法,正接受监察调查

2月6日,中央纪委国家监委网站讯 据中央纪委国家监委驻中央社会工作部纪检监察组、海南省纪委监委消息:中国制药装备行业协会副秘书长遆倩鹤涉嫌严重违法,目前正接受中央纪委...

2026-02-07 22:13

CDE:化学仿制药透皮和局部给药系统黏附性和刺激性/致敏性评估临床试验技术指导原则(试行)资讯

CDE:化学仿制药透皮和局部给药系统黏附性和刺激性/致敏性评估临床试验技术指导原则(试行)

本指导原则适用于TDS化学仿制药。常见适用TDS包括可能描述或称为贴片、透皮贴剂或缓释膜固态制剂产品。应用本指导原则时,请同时参考药物临床试验质量管理规范(GCP)国际人用药...

2026-02-07 13:48

云顶新耀溃疡性结肠炎创新口服药物维适平中国获批资讯

云顶新耀溃疡性结肠炎创新口服药物维适平中国获批

核心产品落地打开业绩增量空间

2026-02-06 16:14

中高端医疗连锁标杆卓正医疗登陆港交所资讯

中高端医疗连锁标杆卓正医疗登陆港交所

卓正医疗本次全球发售股份数目为475万股,最终发售价定为每股59 90港元

2026-02-06 16:10

诺华可善挺(司库奇尤单抗)放射学阴性中轴型脊柱关节炎(nr-axSpA)新适应症在华获批资讯

诺华可善挺(司库奇尤单抗)放射学阴性中轴型脊柱关节炎(nr-axSpA)新适应症在华获批

适用于治疗对非甾体类抗炎药(NSAID)应答不佳的活动性放射学阴性中轴型脊柱关节炎成人患者(其客观征象表现为C反应蛋白(CRP)升高和 或磁共振成像(MRI)证据)

2026-02-06 15:54

天津市互联网诊疗监管实施办法(试行)资讯

天津市互联网诊疗监管实施办法(试行)

医疗机构应当主动与市级监管平台对接,及时上传、更新《医疗机构执业许可证》等相关执业信息,主动接受监督。医疗机构取得《医疗机构执业许可证》后或《医疗机构执业许可证》变...

2026-02-06 08:59

八部委发布《中药工业高质量发展实施方案(2026—2030年)》资讯

八部委发布《中药工业高质量发展实施方案(2026—2030年)》

培育60个高标准中药原料生产基地。协同体系更加健全,中药材种植加工、中药研发生产、流通服务等上下游各环节协同更加紧密,建设5个中药工业守正创新中心,推动一批中药创新药获...

2026-02-05 21:21

国家医保局今年将重点对精神类定点医疗机构开展专项飞检资讯

国家医保局今年将重点对精神类定点医疗机构开展专项飞检

各省级医保部门要组织本辖区内所有精神类定点医疗机构从即日起全面开展自查自纠,重点聚焦但不限于诱导住院、虚假住院、虚构病情、虚构诊疗、伪造文书、违规收费等违法违规使用...

2026-02-05 17:13

替尔泊肽登顶“全球药王”资讯

替尔泊肽登顶“全球药王”

2月4日晚间,礼来发布2025年第四季度及全年财报。财报显示,公司全年营收、净利润均实现大幅增长。

2026-02-05 16:26

蚂蚁阿福发布“长辈模式”资讯

蚂蚁阿福发布“长辈模式”

2月4日消息,蚂蚁阿福App近日完成重要升级,上线专为老年用户设计的长辈模式。

2026-02-05 14:54

国际SOS荣膺“2026年度全球杰出雇主”资讯

国际SOS荣膺“2026年度全球杰出雇主”

今日,国际SOS宣布,公司连续第八年荣获杰出雇主调研机构(Top Employers Institute)授予的杰出雇主认证。

2026-02-05 14:42

默克高管周虹离任,诺和诺德官宣在即,医药行业再迎关键人事变动资讯

默克高管周虹离任,诺和诺德官宣在即,医药行业再迎关键人事变动

默克医药健康全球执行副总裁、中国及国际市场负责人周虹正式离任,其将加盟丹麦制药巨头诺和诺德,接任产品与组合战略执行副总裁一职

2026-02-05 11:58

104亿元!2026年小核酸领域首笔出海BD诞生资讯

104亿元!2026年小核酸领域首笔出海BD诞生

圣因生物与罗氏集团旗下子公司基因泰克达成全球研发合作与许可协议,双方将基于圣因生物专有的RNAi药物研发平台,共同推进一款RNAi疗法的开发。

2026-02-05 11:50

“向光而生·同心前行”2026年世界癌症日特别活动在沪举办资讯

“向光而生·同心前行”2026年世界癌症日特别活动在沪举办

以患者为中心,多方携手共绘癌症科学诊疗新蓝图

2026-02-04 13:13

合成生物企业桦冠生物宣布完成数亿元C轮融资资讯

合成生物企业桦冠生物宣布完成数亿元C轮融资

本轮融资由软银欣创、顺禧基金、常州启航合成生物创投基金、国投创益、长江资本等多家知名机构联合投资,光源资本担任财务顾问,所融资金将重点投向医药与大健康领域新品研发、...

2026-02-04 11:50

AI制药独角兽深度智耀完成6000万美元新一轮融资,加速全栈式研发解决方案落地资讯

AI制药独角兽深度智耀完成6000万美元新一轮融资,加速全栈式研发解决方案落地

本轮融资吸引了信宸资本、金镒资本、凯泰资本等新投资方入局,老股东鼎晖百孚、新鼎资本持续追加投资

2026-02-03 20:03

济川药业联合康方生物,共拓心血管创新药商业化新局资讯

济川药业联合康方生物,共拓心血管创新药商业化新局

伊喜宁®(伊努西单抗注射液)是康方生物自主开发创新的PCSK9单克隆抗体新药,于2024年9月获批上市,用于治疗原发性高胆固醇血症和混合型高脂血症,包括杂合子家族性高胆固醇血...

2026-02-03 19:34

华东医药创新药罗氟司特乳膏0.05%特应性皮炎适应症申报上市资讯

华东医药创新药罗氟司特乳膏0.05%特应性皮炎适应症申报上市

适用于2岁至5岁轻度至中度特应性皮炎患者的局部外用治疗

2026-02-03 19:29

拜耳诺倍戈®第三项适应症在中国获批,用于治疗转移性激素敏感性前列腺癌(mHSPC)

诺倍戈®此前已先后获批用于治疗有高危转移风险的非转移性去势抵抗性前列腺癌(NM-CRPC)成年患者,和联合多西他赛治疗转移性激素敏感性前列腺癌的(mHSPC)成年患者。

2026-02-03 18:42

第101批仿制药参比制剂目录资讯

第101批仿制药参比制剂目录

经国家药品监督管理局仿制药质量和疗效一致性评价专家委员会审核确定,现发布仿制药参比制剂目录(第一百零一批)。

2026-02-03 13:19