语音识别在医疗领域要跨过的那些坎儿

医疗健康 来源:健康界
2014
06/16
12:49
健康界 医疗健康

语音识别即通过麦克风捕捉用户发出的声音,将声波信号转换成机器可以处理的“发音特征”,再从发音和语言的“模型空间”中快速搜索最匹配的句子,即识别结果。语音识别过程就是一个模型匹配的过程,模型训练的好坏直接关系到系统识别的结果。

为了得到一个好的模型,往往需要有大量的原始语音数据来进行训练,特别是对于非特定人的语音识别系统来说,这一点显得更为重要。因此,在开始进行语音识别研究之前,首先要建立一个语音数据库。数据库包括不同性别、年龄、口音的说话人的声音,并且必须具有代表性,能均衡地反映实际使用情况。模型训练就是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数。

目前在医学领域并没有专门的语音识别词库和模型。由于医学术语、药物名称、疾病名称等用词的专业性很强,识别率会大幅下降。我带领团队花费了7个月的时间,分别于iOS平台和Android平台,采用科大讯飞和云之声两个主流第三方SDK,对药品词库的36176个药品名称和疾病词库的23501个疾病名进行了测试,训练出错率较高的词汇,初步搭建了医学语音识别领域的第三方素材库,并决定免费开放给任何有志于开发移动医疗APP的创业团队和个人。

下面以Android为例,具体介绍我们构建体系的流程、标准和测试方法,以帮助各位移动医疗开发人员快速上手:

测试平台:2台android4.0系统手机(小米2、中兴U930HD)、珍立拍系统、科大讯飞SDK

小    组: A组和B组

测试方法:对所有药品和疾病名称进行反复测试,使用纠正训练法,来克服语音识别体系中HMM的训练效果。小组A测试药品,小组B测试疾病,普通话识别。

测试步骤:

1. 医学词汇约有数十万条,前期总结查找筛选最常用词汇并分组。

2. 使用珍立拍系统中的语音识别对所有词库进行第一遍测试。

3. 在第一遍测试的基础上,对筛选出来错误的词汇进行二次测试,再次筛选。

4. 总结出识别易错词汇,两组交叉测试后,随后交给程序人员,按科大讯飞SDK模型训练,输入相应代码,完善建库。

可能存在的影响因素:

1.  读错:由于医学词汇中有很多较为生僻的汉字,读错很难避免,很多医生即使会写这个词,但是发音也可能会错。

规避方法:遇到拿捏不准的汉字时,查找准确读音,尽量避免错误。

2. 环境因素:测试时,所处的环境存在噪音。

规避方法:选择在低噪音环境中测试,但不能完全于安静的环境中测试,因其与日常使用环境不符。

3. 汉字的同音字:例如“弱视”“荨麻疹”,识别结果“若是”“寻麻疹”。

4. 汉字尾音:例如“肝癌”,识别结果为“刚来”。

5. 实际发音影响:例如“阻生齿”,识别结果“主生殖”。

下面以疾病词汇举例:

测试小结:

由统计结果可以看出,疾病名的识别率高于药品名。笔者分析,造成此结果的原因在于,疾病名的广普率要高于药品名,所以各个语音识别公司比较重视,而且疾病生僻汉字较少,而药品种类要远多于疾病种类,其中生僻汉字也较多。二次测试的正确率较一次测试大约提升了一个百分点左右,还是可以适当减少错误数据库中的词汇量。

音节短的词出错率较高,如:单音节词,痣(识别结果“志”),双音节词,义眼(识别结果“一眼”),长音节词出错率低,原因可能是音节越短的词,其同音节的普通词较其更常见,而且如果其尾音特殊的话,影响较大。

针对医学专业词汇识别率低的问题,目前可使用以下三种解决办法:

一、  扩充自定义词库

虽然有用户词表,但是目前科大讯飞用户词表仅限数量2000,经沟通后他们正在扩大词汇表数量中。但如果数据过大,将会导致数据包过重的问题,而移动端由于存储和运算能力受限,所以无法满足数量庞大的整个医学词库,因此我们只能先做常用库。

二、  搭建第三方素材库

语音识别虽然在实用性上已得到很大提高,但是由于目前语音识别的单一性(只能单纯的识别中文或者英文),以及使用环境、语音差异化等因素的影响,容易造成识别错误。就这些因素而言,我们为此做了大量的基础工作,用于搭建第三方数据库,在尽可能排除其它干扰因素的情况下,检测出识别错误的词汇,也为下一步构建专业领域的识别模型搭建出了样本数据库(针对大量样本数据库,精简出识别错误的小样本数据库,减少模型训练词库)。

三、  构建专业领域的识别模型

对于有大量专业词汇的识别系统来说,使用模型训练可以有效提升识别率,目前模型训练比较常用的有四种方法:最大似然估计、纠正训练法、最小分类错误、最大互信息方法。模型训练需要专业的技术,并与语音识别公司进行合作,由企业提供词库信息和语音集,专业人员采用模型训练对需要识别的词库进行训练,最终给出个性化定制的识别模型,以提升识别率。

语音识别技术在移动医疗领域中的应用会越来越普遍,但还有大量的基础工作需要我们大家齐心协力去完成。希望业内的精英之士能够对此多交流,多合作,抛开一些利益的纠葛,共同为行业的发展贡献出自己的力量。


来源:健康界

为你推荐

又一家药企被取消国家药品集采中选资格资讯

又一家药企被取消国家药品集采中选资格

4月30日,国家组织药品联合采购办公室发布公告,取消哈尔滨力强药业有限责任公司洛索洛芬钠凝胶贴膏中选资格并将该企业列入违规名单。

2026-04-30 15:19

国家药监局原副局长陈时飞被判14年资讯

国家药监局原副局长陈时飞被判14年

4月29日,上海市第二中级人民法院一审公开宣判国家药品监督管理局原党组成员、副局长陈时飞受贿案,对被告人陈时飞以受贿罪判处有期徒刑14年,并处罚金人民币400万元;扣押在案...

2026-04-30 10:08

黄果任国家药品监督管理局局长资讯

黄果任国家药品监督管理局局长

任命黄果为国家药品监督管理局局长,免去李利的国家药品监督管理局局长职务。

2026-04-29 21:46

微滔生物完成超 5000 万美元 A 轮、A + 轮融资,专注体内 CAR-T 细胞疗法赛道资讯

微滔生物完成超 5000 万美元 A 轮、A + 轮融资,专注体内 CAR-T 细胞疗法赛道

本轮融资由正心谷资本与德诚资本分别领投,OrbiMed(奥博资本)、汉康资本、卫材创新风投基金、建发新兴投资等知名机构跟投,老股东启明创投、顺禧资本、杏泽资本持续加码

2026-04-29 13:21

“A to H 18A第一股”诞生!迈威生物正式登陆香港联交所主板资讯

“A to H 18A第一股”诞生!迈威生物正式登陆香港联交所主板

2026年4月28日,迈威(上海)生物科技股份有限公司(以下简称“迈威生物”,A股代码:688062 SH,港股代码:02493 HK)在香港联合交易所主板正式挂牌上市,成为首家“A to H”的18A上市公司。

2026-04-28 19:22

全面接轨国际,药物临床试验质量管理规范再升级资讯

全面接轨国际,药物临床试验质量管理规范再升级

根据国家药监局发布的2025年第125号公告,自2026年3月31日后实施的药物临床试验,均适用《E6(R3):药物临床试验质量管理规范技术指导原则》(下称 ICH E6(R3))。

2026-04-28 19:13

百济神州引入PD-1/CTLA-4/VEGF-A三抗资讯

百济神州引入PD-1/CTLA-4/VEGF-A三抗

4月28日,百济神州发布公告称,2026年4 月 24 日,百济神州有限公司的全资子公司广州百济神州生物制药有限公司与华辉安健(北京)生物科技有限公司签订了一份《独家选择权、...

2026-04-28 09:49

希润医疗完成数千万元融资,打造全链条脑机接口康复产品线资讯

希润医疗完成数千万元融资,打造全链条脑机接口康复产品线

由无锡梁溪科创产业基金独家投资。

2026-04-27 13:19

一家环保上市企业要10亿元收购一家CRO公司资讯

一家环保上市企业要10亿元收购一家CRO公司

4月26日晚间,创业板上市公司中赋科技发布公告,计划筹资收购军科正源(北京)药物研究有限责任公司。

2026-04-27 11:02

司美格鲁肽专利已经到期,为什么国内还没有产品获批上市资讯

司美格鲁肽专利已经到期,为什么国内还没有产品获批上市

2026年3月底,司美格鲁肽核心化合物专利在中国正式到期。

2026-04-26 18:56

药品附条件批准上市申请审评审批工作程序资讯

药品附条件批准上市申请审评审批工作程序

附条件批准时,每个附条件批准的适应症单独设置药品注册证书有效期,原则上,在确证性研究完成时限的基础上增加一年。确证性研究完成时限由药审中心在审评中与申请人沟通交流后...

2026-04-26 10:58

CDE:抗体偶联药物首次申报临床试验药学资料撰写指导原则资讯

CDE:抗体偶联药物首次申报临床试验药学资料撰写指导原则

本指导原则基于 ICH M4Q( R1)总体框架, 格式体例与之保持一致, 在其框架下结合抗体偶联药物的药学研究特点,细化了 IND 申报药学资料的撰写要求,旨在为该类药物 IN...

2026-04-25 21:39

蚂蚁健康向医院开放“智慧医疗AI一体化方案” 支持智能体、云陪诊、本地化模型部署资讯

蚂蚁健康向医院开放“智慧医疗AI一体化方案” 支持智能体、云陪诊、本地化模型部署

4月25日,在2026中国医院信息网络大会(CHIMA 2026)上,蚂蚁健康面向全国医院及医疗机构推出“智慧医疗AI一体化方案”。

2026-04-25 20:09

美敦力 5.5 亿美元收购 Scientia Vascular,加码神经血管赛道布局资讯

美敦力 5.5 亿美元收购 Scientia Vascular,加码神经血管赛道布局

Scientia Vascular 是专注于神经血管创新器械研发的新兴企业,核心产品管线聚焦颅内血管病变介入治疗领域

2026-04-25 15:50

聚焦预防接种全龄升级,多方合力开展“成人全周期免疫促进暨带状疱疹公益科普”资讯

聚焦预防接种全龄升级,多方合力开展“成人全周期免疫促进暨带状疱疹公益科普”

4月25日,国家疾病预防控制局在上海举办主题宣传活动,呼吁“预防接种,苗助健康,全民行动”。

2026-04-25 15:41

超亿元 A 轮融资!奥明星程以 AI4S 定义下一代生物智能基础设施资讯

超亿元 A 轮融资!奥明星程以 AI4S 定义下一代生物智能基础设施

由深创投与复星医药(复健资本)联合领投,太平股权、广东中医药大健康基金、杭实集团等多家头部投资机构、产业链龙头企业及多地国资跟投。

2026-04-24 18:28

Cytiva ÄKTA与Biacore系列产品实现本地生产, 以“桐庐样本”赋能生物医药“加速度”资讯

Cytiva ÄKTA与Biacore系列产品实现本地生产, 以“桐庐样本”赋能生物医药“加速度”

依托桐庐生产基地,Cytiva持续提升本土供应能力,以更短的交付周期与定制化支持,精准匹配中国研发节奏,深度践行“在中国,为中国”承诺

2026-04-24 18:13

全球首个治疗遗传性耳聋基因疗法获批资讯

全球首个治疗遗传性耳聋基因疗法获批

4 月 23 日,再生元宣布,美国 FDA 已经加速批准其在研基因疗法Otarmeni(lunsotogene parvec-cwha)上市,该药品成为首个也是目前唯一获批用于治疗遗传性听力损失的基因疗法。

2026-04-24 18:01

CDE:治疗用重组蛋白药物首次申报临床试验药学资料撰写指导原则资讯

CDE:治疗用重组蛋白药物首次申报临床试验药学资料撰写指导原则

本指导原则基于 ICH M4Q( R1)总体框架, 格式体例与之保持一致, 在其框架下结合治疗用重组蛋白药物的药学研究特点,细化了 IND 申报药学资料的撰写要求,旨在为该类药...

2026-04-24 12:44