全球首个百亿级人类基因组基础模型Genos发布

医疗健康 来源:医谷网
2025
10/23
15:54
医谷网 医疗健康

在生命科学的前沿探索中,我们早已能高效“读出”生命的序列,但如何从30亿碱基对中“读懂”生命奥秘,长期以来都是一项巨大挑战,如同在没有地图的荒野中寻找路径。

10月23日,在第二十届国际基因组学大会(ICG-20)上,华大生命科学研究院与之江实验室联合发布了全球首个百亿参数人类基因组通用基础模型——Genos。这一针对人类基因组深度优化的基因组基础模型,可支持高达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。

Genos的推出标志着基因组研究从“读出”碱基序列迈向“读懂”生命底层逻辑的一次关键转折,有望为临床疾病诊断、个人基因组解读及前沿科学研究带来突破性变革。

据悉,Genos的相关成果已发表于国际学术期刊GigaScience。

文章截图(https://doi.org/10.1093/gigascience/giaf132

广度、深度、效率兼具,一款真正具有生产力的基因组大模型

要读懂“生命之书”,首先需要一本完整的“字典”。

基因组学领域内的现有模型大多基于一到两个参考基因组进行训练,难以捕捉人类丰富的遗传多样性。而Genos则系统整合了人类泛基因组参考联盟(HPRC)、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次汇聚了全球范围内636个“端粒到端粒”(T2T)级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,旨在从源头减少数据偏见,更全面地代表人类遗传多样性。

基因组的语言极其复杂,一个微小的单碱基突变,其影响可能由百万碱基之外的“遥远”调控元件决定。这要求模型既要有“显微镜”般的单碱基精度,又要有“广角镜”般的百万级超长上下文理解能力。

如同阅读一部鸿篇巨著,既能一字不差地记住细节,又能洞悉全局的宏大叙事。Genos通过混合专家(Mixture-of-Experts, MoE)架构,巧妙地解决了这一挑战。MoE架构如同一个拥有众多顶尖专家的智慧团队,面对任务时,总能精准调度最相关的几位专家协同处理,而不是调动所有人全部待命。这一“按需激活”的机制,让Genos在拥有百亿级参数的庞大知识总量的同时,推理成本和资源消耗却远低于同等规模的模型,真正实现了“既强大,又好用”。

为了全面验证模型的性能,研发团队进行了一系列测试。在基因组元件识别、远程调控预测、突变致病性预测等经典评测任务里,Genos在超过一半的任务里比所有现有模型都表现更好,而且长序列评测任务里,如突变热点识别和族群分类上,Genos的表现远超同类模型,展现了其强大的上下文分析能力,有效破译基因组中的“暗物质”。

更重要的是,Genos在直接面向临床应用的致病性突变解读任务中,实现了92%的准确性,当结合021科学基础模型后,准确率更是高达98.3%,为临床诊断提供了全新的高效工具。综合多项评测结果,Genos在各项核心任务中的表现均全面超越了现有最佳水平(SOTA),证明了其卓越且全面的能力。

共有、共为、共享,让前沿科技触手可及

一个模型无论多么强大,如果不能被方便地部署和使用,其价值便大打折扣。目前,全球基因组学领域尚无一款能够被开发者和研究者直接部署、用于下游应用的百亿级人类基因组基础大模型。而Genos的发布,则填补了这一空白。它是一个可以走向临床、走向个人、走向每一个实验室的“实践先锋”,为无限的下游应用创新提供了坚实的地基。

今年是人类基因组草图绘制完成25周年。“共有、共为、共享”,既是人类基因组计划的精神传承,也是Genos与生俱来的核心理念。

发布会上,华大生命科学研究院宣布,Genos模型将全面、彻底地开源开放,且同时提供12亿和100亿参数两个版本,满足不同应用场景的需求。目前,两个版本的模型权重、架构细节与完整训练流程,均已在GitHub、Hugging Face、魔搭等平台依据MIT开源协议公开发布,供全球开发者和科研人员自由使用。同时,在之江实验室的开放平台Zero2X也已发布。

另外,考虑到并非所有使用者都拥有强大的算力资源,该模型已被深度整合进DCS Cloud云平台。用户无需进行复杂的安装配置,即可一键调用Genos,平台为每个账户提供了高达10万次的免费推理服务,极大地降低了基因组智能分析的门槛。

目前,在科研领域,Genos模型通过与DCS cloud结合,能仅凭DNA序列“秒级”预测RNA表达谱,将过去数周甚至数月才能完成的生物信息分析流程极大提速。此外,Genos模型也已整合进生命科学数据库CNGBdb,可帮助用户精准预测细胞表达量,高效筛选和验证关键候选基因,大幅加速科研发现。

在临床应用领域,Genos模型与华大已发布的GeneT深度思考模型结合,能为遗传疾病诊断提供专家级的多模态解读。而在个人健康领域,目前Genos模型已整合进BGE平台,将赋能个人基因组报告解读,把复杂的生命代码翻译成每个人都能读懂的、个性化的健康“说明书”。

值得一提的是,Genos的诞生,源自一次大胆的跨界融合与人才培养实践。该模型的核心研发团队,来自华大生命科学研究院与之江实验室联合发起的“大模型种子班”。这个汇聚了生物信息专家与计算科学骨干的精英团队,依托“以问题导向实训、以任务驱动创新”的模式,正推动生命科学研究从“数据挖掘”迈向“智能涌现”的新纪元。也正是这种跨界碰撞,为Genos的颠覆性创新注入了最核心的动力。

此次Genos的发布,标志着一个新时代的开启:一个基因组智能分析的时代,一个人人都能读懂自己生命天书的时代,正加速到来。为持续推动模型迭代,华大生命科学研究院近期还联合国内外多家单位共同发起了“十万长读长大人群联盟(Long100K Genomes Consortium)”和“百亿细胞计划(10BC)”两项大科学计划。其中,“十万长读长大人群联盟”将依托最新的Cyclone长读长测序技术,完成10万人的“端粒到端粒”级别完整基因组测序,为基因组大模型提供高质量的训练数据。而“百亿细胞计划”则将依托Stereo-Cell超高通量细胞组学技术,完成百亿细胞测序,助力基因和细胞的融合大模型开发。从基因组到多组学,一个更强大的生命科学基础模型正在孕育之中。

为你推荐

复星医药14.12亿元收购绿谷医药,要再启“九期一”资讯

复星医药14.12亿元收购绿谷医药,要再启“九期一”

12月15日,复星医药发布公告称,控股子公司复星医药产业拟出资共计14 12亿元控股投资绿谷医药。资金来源为拟以自筹资金支付本次收购的对价。

2025-12-16 22:40

安领科生物完成近 5000 万美元 A 轮追加融资,加速 ADC 全球临床与技术平台创新​资讯

安领科生物完成近 5000 万美元 A 轮追加融资,加速 ADC 全球临床与技术平台创新​

本轮融资由老股东君联资本与新晋投资方美团龙珠联合领投,蓝驰创投、元生创投、五源资本等多家知名新老股东跟投

2025-12-16 11:28

AI4S 赋能医药创新,哲源科技完成亿元 A1 轮融资资讯

AI4S 赋能医药创新,哲源科技完成亿元 A1 轮融资

国科投资(中国科技产业投资管理有限公司)领投,泽源基金、睿智医药联合跟投

2025-12-16 11:22

华东医药“双喜临门”!GLP-1/GIP双靶点减重药II期数据亮眼,MUC17 ADC创新药获FDA孤儿药认定资讯

华东医药“双喜临门”!GLP-1/GIP双靶点减重药II期数据亮眼,MUC17 ADC创新药获FDA孤儿药认定

创新多肽类人GLP-1(胰高血糖素样肽-1)受体和GIP受体(葡萄糖依赖性促胰岛素多肽)的双靶点长效激动剂HDM1005注射液在体重管理适应症中国II期临床试验中取得了积极结果

2025-12-15 17:13

自2028年起,每年3月底前完成上年度清算,国家医保局发布《医保基金清算提质增效三年行动计划》资讯

自2028年起,每年3月底前完成上年度清算,国家医保局发布《医保基金清算提质增效三年行动计划》

自2028年起,实现每年3月底前完成上年度清算,清算资金占年度医保基金拨付的3%左右,推进季度清算等创新模式。

2025-12-15 10:29

全国医疗保障工作会议召开,2026年国家医保做什么?资讯

全国医疗保障工作会议召开,2026年国家医保做什么?

2025年12月13日,全国医疗保障工作会议在北京召开。

2025-12-14 21:46

远大赛威信六价诺如疫苗研发持续推进,直指百亿元市场资讯

远大赛威信六价诺如疫苗研发持续推进,直指百亿元市场

该疫苗是目前全球临床进展最快的六价诺如疫苗,采用先进的重组病毒样颗粒(VLP)技术,涵盖了六个全球高流行基因型别,理论覆盖范围可超全球90%的诺如病毒流行株

2025-12-14 13:15

圣因生物完成超 1.1 亿美元 B 轮融资,加速 RNAi 疗法全球布局资讯

圣因生物完成超 1.1 亿美元 B 轮融资,加速 RNAi 疗法全球布局

本轮融资由知名产业机构领投,国际主权基金、中国生物制药、君联资本等十余家机构跟投,全球制药巨头礼来公司战略入局,高瓴创投、启明创投等现有股东持续加码支持,融资规模创...

2025-12-12 16:59

操纵自家股票还亏损,金城医药董事长被处罚资讯

操纵自家股票还亏损,金城医药董事长被处罚

2025 年12 月10日,公司收到实际控制人赵叶青先生的通知,其收到中国证监会《行政处罚决定书》。

2025-12-12 11:40

又一款抗流感药物获批资讯

又一款抗流感药物获批

12月11日晚间,健康元发布公告称,公司研发的玛帕西沙韦胶囊收到国家药品监督管理局核准签发的《药品注册证书》。

2025-12-12 10:41

投后估值达21.37亿元,实体瘤细胞治疗领军企业君赛生物递表港交所资讯

投后估值达21.37亿元,实体瘤细胞治疗领军企业君赛生物递表港交所

君赛生物共有5款在研产品,其中核心产品也是进展最快的是GC101,正开展上市前的关键II期临床试验,有望成为国内首个获批上市的TIL细胞创新药

2025-12-12 09:24

ESMO-IO | ORR达41.7%!君赛生物GC101 TIL治疗晚期后线非小细胞肺癌I期数据首次公布资讯

ESMO-IO | ORR达41.7%!君赛生物GC101 TIL治疗晚期后线非小细胞肺癌I期数据首次公布

这不仅是全球首个无需高强度清淋化疗、无需IL-2给药的TIL疗法治疗肺癌的临床研究,也是国内首个公开披露该领域数据的注册性临床研究。

2025-12-12 09:17

君合盟生物启动重组 A 型肉毒毒素治疗成人上肢痉挛状态临床 III 期试验,并完成首例患者入组资讯

君合盟生物启动重组 A 型肉毒毒素治疗成人上肢痉挛状态临床 III 期试验,并完成首例患者入组

该临床试验由复旦大学附属华山医院李放教授和上海市养志康复医院(即上海市阳光康复中心)靳令经教授联合牵头

2025-12-11 21:06

Medidata发布全新调研报告:临床试验AI应用价值凸显,超七成用户反馈“达到或超预期”资讯

Medidata发布全新调研报告:临床试验AI应用价值凸显,超七成用户反馈“达到或超预期”

基于对来自全球制药公司、生物科技公司及合同研究组织(CRO)中超200位核心决策者的深度调研,报告显示,目前AI在改善患者招募、优化数据管理、控制运营成本和提升试验效率等方...

2025-12-11 20:57

近20年首个全新类别抗菌药物醋酸来法莫林纳入医保,开启中国成人社区获得性肺炎治疗普惠新篇章资讯

近20年首个全新类别抗菌药物醋酸来法莫林纳入医保,开启中国成人社区获得性肺炎治疗普惠新篇章

该产品继2025年6月30日获得国家药品监督管理局批准用于治疗成人社区获得性肺炎(CAP)后又纳入国家医保目录

2025-12-11 20:50

国家药监局同意吉林、海南开展优化药品补充申请审评审批程序改革试点资讯

国家药监局同意吉林、海南开展优化药品补充申请审评审批程序改革试点

同意你们开展优化药品补充申请审评审批程序改革试点。

2025-12-11 11:04

国家药监局发布第三批调出参比制剂目录品种资讯

国家药监局发布第三批调出参比制剂目录品种

第三批调出参比制剂目录品种清单。

2025-12-11 11:00

全球首发!中国率先批准博优维®(那米司特)用于治疗进展性肺纤维化资讯

全球首发!中国率先批准博优维®(那米司特)用于治疗进展性肺纤维化

继近期在美国和中国获批用于治疗特发性肺纤维化(IPF)之后,PPF是那米司特获批的第二个适应症

2025-12-10 19:07

专注 “生物学 + AI” ,普瑞基准完成超亿元 D 轮融资,加速 AI 驱动新药研发资讯

专注 “生物学 + AI” ,普瑞基准完成超亿元 D 轮融资,加速 AI 驱动新药研发

本轮融资由信立泰、广投资本、申宏中恒基金联合领投,老股东金谷汇枫、聚翊投资持续跟投

2025-12-10 15:55

迈斯拓扑完成近亿元天使轮融资,加速新型医用同位素国产化资讯

迈斯拓扑完成近亿元天使轮融资,加速新型医用同位素国产化

本轮融资由中科创星领投,曙日辰星、正景资本跟投,指数资本担任独家财务顾问。

2025-12-10 11:18