专业唇语阅读者识别唇语的准确率只有20%到60%。人类在日常说话过程中嘴唇的微小移动很难被可靠地解读,尤其是在有一定距离,或画面不清晰的情况下。不过,唇语并不只是美剧《海军罪案调查科》中的噱头,对全球的失聪者来说,这是一项有用的工具。如果能可靠地解读,那么将给数百万人带来帮助。
牛津大学的最新研究描述了一种名为LipNet的人工智能系统。通过“观看”人类说话的视频,以及输入相应文字,这一软件对唇语的解读准确率高达93.4%。这项研究得到了谷歌(微博)旗下DeepMind的资助。
此前最佳的唇语解读工具只能实现逐个单词的解读,准确率只有79.6%。牛津大学研究员表示,新系统获得成功的关键在于通过不同方式去思考这一问题。这一系统不再利用可视元素,即说话者嘴型的变化去训练人工智能,而是每次都处理一整个句子。这使得人工智能可以学会单词对应于什么样的嘴型变化。
为了训练这一系统,研究员向人工智能展示了2.9万条带文字标签的视频,每段视频长度为3秒。而为了观察专业唇语阅读者做得如何,该团队还邀请了“牛津学生残疾人社团”的3名成员,用300条随机视频去进行类似的测试。这些专家的平均错误率为47.7%,而人工智能的错误率只有6.6%。
尽管这一项目取得了成功,但也暴露出了当代人工智能研究的局限。在指导人工智能如何阅读唇语的过程中,牛津大学团队使用了经过设计的视频。视频中的所有人物都面向前方,光线明亮,说出标准结构的语句。
视频中的典型语句时长为3秒钟,例如:“Place blue in m 1 soon。”这其中包括命令、颜色、介词、字母、数字,以及副词。所有语句都采用这样的模式。因此,人工智能的超高准确率只是在一种极端情况下取得的。如果要求人工智能从随机的YouTube视频中阅读唇语,那么结果可能很不准确。
有其他研究人员指出,利用这种特殊视频去训练并不符合真实世界场景。不过,论文作者南多·德弗雷塔斯(Nando de Freitas)为自己的成果进行了辩护。他指出,该团队曾尝试过其他视频,但这些视频带来了太多“噪音”。这些视频各不相同,因此人工智能无法取得有意义的结论。这也意味着,完美的数据集可能并不存在。德弗雷塔斯认为,考虑到这一人工智能的准确率,最终情况如何将取决于任务本身。
OpenAI的杰克·克拉克(Jack Clark)表示,如果希望在现实世界中得到应用,那么这一人工智能还需要三方面的优化:人们在现实世界场景中大量的说话视频;让人工智能可以从多个不同角度去阅读唇语;以及让人工智能可预测的短语类型更多样化。
克拉克表示:“这项技术具备显而易见的应用,但这看起来似乎并不可能。”如果人工智能可以学会阅读唇语,那么将适用于多种场景。此类系统可以被用于帮助听力障碍人士了解周围发生的对话,或是让其他人工智能更好地辨别视频中的声音,生成准确的字幕。
来源:腾讯科技 作者:编译:陈桦
为你推荐
资讯 2025生命科学与医学领域新增“两院”院士名单
今日,2025年两院院士增选结果正式揭晓,共有144人当选。其中,共选举产生中国科学院院士73人,选举产生中国工程院院士71人。
2025-11-21 15:35
资讯 攻克疫苗佐剂卡脖子难题,百达信生物获超 3000 万 Pre-A 轮融资
本轮融资由专注生物医疗赛道的领航新界资本独家领投,所募资金将重点用于加速化学合成 QS-21 等核心佐剂原料的 GMP 生产基地建设,推动全球商业化进程,并拓展新型佐剂研发管线。
2025-11-21 15:31
资讯 修实生物完成近亿元 A 轮融资,深耕多肽生物合成加速全球化
本轮融资由老股东华泰紫金领投,拾萃资本追加投资,金鼎资本、湖南艾臣联合参与,小饭桌创投依托生态资源助力融资高效完成,资金将重点用于海外市场拓展与核心技术研发升级。
2025-11-21 15:30
资讯 鲲石生物完成 5000 万 A 轮融资 加码巨噬细胞药物攻坚实体瘤
本轮资金将重点用于推进第三代 CAR-M(嵌合抗原受体巨噬细胞)药物的临床转化及多管线布局,为实体瘤治疗领域注入创新动力。
2025-11-21 15:21
资讯 专访精鼎医药郑唯玲:全球医药产业格局重塑中,中国从“市场红利”走向“创新红利”
中国医药创新已从全球产业链 “追随者”,成长为有自主话语权的 “参与者” 乃至 “引领者”,核心竞争力从单纯成本优势,升级为 “效率、质量、创新” 三位一体的综合实...
文/朱萍 2025-11-20 14:16
资讯 武田中国创新中心在蓉开幕,以患者为中心,加速共建数字医疗创新生态
TCIC是武田数字化创新网络的重要组成部分,也是武田首个将同步推进数字医疗解决方案开发与落地应用的创新中心。
2025-11-18 14:40
资讯 全球首个FRα ADC爱拉赫®获常规批准,华东医药创新转型加速“开花结果”
该药物用于治疗既往接受过1-3线系统性治疗的FRα阳性铂耐药卵巢癌(PROC),是目前全球首个且唯一获批用于该适应症的靶向FRα的ADC药物。
2025-11-17 18:55
资讯 改变焕新生!2025“鼓5人生”肺癌患者关爱公益徒步活动在沪成功举办
2025年11月16日,由中华社会救助基金会发起、爱心企业阿斯利康中国参与支持的“鼓5人生”肺癌患者关爱项目(以下简称“鼓5人生”项目)再度开启。
2025-11-17 16:20
资讯 腾迈医药获 2200 万美元 A 轮追加融资,加速 AI 驱动药物研发全流程创新
本轮融资由一村资本(V-Capital)与芯能创投(KHK Fund)共同领投,奥博资本、启明创投、成为资本、红杉资本等现有投资方悉数跟投。
2025-11-17 15:06
资讯 总金额超8亿美金,斯丹赛生物治疗转移性结直肠癌CAR-T药物“出海”
近日,美国细胞治疗公司Lyell Immunopharma宣布,已获得Innovative Cellular Therapeutics(斯丹赛生物)LYL273(前身为GCC19CART)的全球权利,将进一步强化公司在实体瘤CAR-T领域的研发布局。
2025-11-16 21:42
资讯 美年健康发布国内首款 AI 衰老评估产品“血液学时钟”,抢占万亿长寿健康科技赛道
依托亿级健康大数据与前沿AI算法的创新产品,彻底突破了传统衰老评估依赖高成本组学检测的技术壁垒,将科学抗衰从高端科研与小众消费场景推向大众健康管理领域
2025-11-16 18:42










