语音识别在医疗领域要跨过的那些坎儿

医疗健康 来源:健康界
2014
06/16
12:49
健康界 医疗健康

语音识别即通过麦克风捕捉用户发出的声音,将声波信号转换成机器可以处理的“发音特征”,再从发音和语言的“模型空间”中快速搜索最匹配的句子,即识别结果。语音识别过程就是一个模型匹配的过程,模型训练的好坏直接关系到系统识别的结果。

为了得到一个好的模型,往往需要有大量的原始语音数据来进行训练,特别是对于非特定人的语音识别系统来说,这一点显得更为重要。因此,在开始进行语音识别研究之前,首先要建立一个语音数据库。数据库包括不同性别、年龄、口音的说话人的声音,并且必须具有代表性,能均衡地反映实际使用情况。模型训练就是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数。

目前在医学领域并没有专门的语音识别词库和模型。由于医学术语、药物名称、疾病名称等用词的专业性很强,识别率会大幅下降。我带领团队花费了7个月的时间,分别于iOS平台和Android平台,采用科大讯飞和云之声两个主流第三方SDK,对药品词库的36176个药品名称和疾病词库的23501个疾病名进行了测试,训练出错率较高的词汇,初步搭建了医学语音识别领域的第三方素材库,并决定免费开放给任何有志于开发移动医疗APP的创业团队和个人。

下面以Android为例,具体介绍我们构建体系的流程、标准和测试方法,以帮助各位移动医疗开发人员快速上手:

测试平台:2台android4.0系统手机(小米2、中兴U930HD)、珍立拍系统、科大讯飞SDK

小    组: A组和B组

测试方法:对所有药品和疾病名称进行反复测试,使用纠正训练法,来克服语音识别体系中HMM的训练效果。小组A测试药品,小组B测试疾病,普通话识别。

测试步骤:

1. 医学词汇约有数十万条,前期总结查找筛选最常用词汇并分组。

2. 使用珍立拍系统中的语音识别对所有词库进行第一遍测试。

3. 在第一遍测试的基础上,对筛选出来错误的词汇进行二次测试,再次筛选。

4. 总结出识别易错词汇,两组交叉测试后,随后交给程序人员,按科大讯飞SDK模型训练,输入相应代码,完善建库。

可能存在的影响因素:

1.  读错:由于医学词汇中有很多较为生僻的汉字,读错很难避免,很多医生即使会写这个词,但是发音也可能会错。

规避方法:遇到拿捏不准的汉字时,查找准确读音,尽量避免错误。

2. 环境因素:测试时,所处的环境存在噪音。

规避方法:选择在低噪音环境中测试,但不能完全于安静的环境中测试,因其与日常使用环境不符。

3. 汉字的同音字:例如“弱视”“荨麻疹”,识别结果“若是”“寻麻疹”。

4. 汉字尾音:例如“肝癌”,识别结果为“刚来”。

5. 实际发音影响:例如“阻生齿”,识别结果“主生殖”。

下面以疾病词汇举例:

测试小结:

由统计结果可以看出,疾病名的识别率高于药品名。笔者分析,造成此结果的原因在于,疾病名的广普率要高于药品名,所以各个语音识别公司比较重视,而且疾病生僻汉字较少,而药品种类要远多于疾病种类,其中生僻汉字也较多。二次测试的正确率较一次测试大约提升了一个百分点左右,还是可以适当减少错误数据库中的词汇量。

音节短的词出错率较高,如:单音节词,痣(识别结果“志”),双音节词,义眼(识别结果“一眼”),长音节词出错率低,原因可能是音节越短的词,其同音节的普通词较其更常见,而且如果其尾音特殊的话,影响较大。

针对医学专业词汇识别率低的问题,目前可使用以下三种解决办法:

一、  扩充自定义词库

虽然有用户词表,但是目前科大讯飞用户词表仅限数量2000,经沟通后他们正在扩大词汇表数量中。但如果数据过大,将会导致数据包过重的问题,而移动端由于存储和运算能力受限,所以无法满足数量庞大的整个医学词库,因此我们只能先做常用库。

二、  搭建第三方素材库

语音识别虽然在实用性上已得到很大提高,但是由于目前语音识别的单一性(只能单纯的识别中文或者英文),以及使用环境、语音差异化等因素的影响,容易造成识别错误。就这些因素而言,我们为此做了大量的基础工作,用于搭建第三方数据库,在尽可能排除其它干扰因素的情况下,检测出识别错误的词汇,也为下一步构建专业领域的识别模型搭建出了样本数据库(针对大量样本数据库,精简出识别错误的小样本数据库,减少模型训练词库)。

三、  构建专业领域的识别模型

对于有大量专业词汇的识别系统来说,使用模型训练可以有效提升识别率,目前模型训练比较常用的有四种方法:最大似然估计、纠正训练法、最小分类错误、最大互信息方法。模型训练需要专业的技术,并与语音识别公司进行合作,由企业提供词库信息和语音集,专业人员采用模型训练对需要识别的词库进行训练,最终给出个性化定制的识别模型,以提升识别率。

语音识别技术在移动医疗领域中的应用会越来越普遍,但还有大量的基础工作需要我们大家齐心协力去完成。希望业内的精英之士能够对此多交流,多合作,抛开一些利益的纠葛,共同为行业的发展贡献出自己的力量。


来源:健康界

为你推荐

诺和诺德:司美格鲁肽“保护期”将持续至2027年4月资讯

诺和诺德:司美格鲁肽“保护期”将持续至2027年4月

近日,诺和诺德全球总裁兼首席执行官杜麦克(Mike Doustdar)首度明确表态:司美格鲁肽在中国的监管数据保护将持续至2027年第二季度,届时仿制药才能开始合法进入市场。

2026-06-21 13:42

《中国阻塞性睡眠呼吸暂停公众认知调研报告》发布资讯

《中国阻塞性睡眠呼吸暂停公众认知调研报告》发布

OSA认知与诊疗缺口待补,专家呼吁推动早筛早诊

2026-06-21 11:28

第四批全国中成药集采与第二批接续采购中选结果资讯

第四批全国中成药集采与第二批接续采购中选结果

近日,全国中成药联合采购办公室正式发布《关于公布全国中成药采购联盟集中采购中选结果的通知》,备受业界关注的第四批全国中成药集中带量采购及第二批接续采购中选结果尘埃落定。

2026-06-20 21:08

科创板支持脑机接口、基因工程相关创新企业上市,已有企业申报资讯

科创板支持脑机接口、基因工程相关创新企业上市,已有企业申报

近日,上交所发布《上海证券交易所科创板企业发行上市申报及推荐暂行规定(征求意见稿)》,对外公开征求意见。

2026-06-19 22:12

又是一个父亲节,关注和做好前列腺癌早期筛查资讯

又是一个父亲节,关注和做好前列腺癌早期筛查

前列腺癌被称为中老年男性的隐形杀手——隐形在于早期几乎没有症状,杀手则在于部分恶性程度高的前列腺癌进展迅速,一旦发生转移,预后显著变差。

2026-06-19 14:59

低活跃预测不等于低风险,台风、飓风、强降雨和洪涝企业应做好哪些应对?资讯

低活跃预测不等于低风险,台风、飓风、强降雨和洪涝企业应做好哪些应对?

随着北半球夏季极端天气高发期到来,台风、飓风、强降雨和洪涝等风暴相关风险进入重点关注阶段。世界领先的健康和安全风险服务企业国际SOS提醒在全球运营的企业:风暴季准备的关...

2026-06-18 21:41

药石科技发布“绿色智能化学引擎”战略,强化下一代疗法CRDMO平台能力资讯

药石科技发布“绿色智能化学引擎”战略,强化下一代疗法CRDMO平台能力

CPHI China 2026期间,南京药石科技股份有限公司(股票代码:300725 SZ,以下简称“药石科技”)在上海举行集团战略发布会

2026-06-18 13:49

第二批全国中药饮片集采中选结果公示资讯

第二批全国中药饮片集采中选结果公示

6月16日,全国中药饮片联盟集中采购拟中选结果正式公布,根据公示结果信息,共有21465条拟中选信息,公示期至6月22日。

2026-06-18 10:42

因美纳在华推出移动式生信分析解决方案,推进蛋白质组学生态合作资讯

因美纳在华推出移动式生信分析解决方案,推进蛋白质组学生态合作

近日,因美纳正式推出“因美纳生信移动宝”,该生信分析解决方案采用移动式部署模式,旨在将DRAGEN™驱动的高性能算力直接送达科研与临床研究一线。同期,因美纳进一步强化其在...

2026-06-18 09:55

治疗早泄药物国内获批资讯

治疗早泄药物国内获批

6月15日,国家药监局药品批准证明文件送达信息显示,Plethora Solutions 和复星医药(600196 SH;02196 HK)联合申报的 5 1 类药物利多卡因丙胺卡因气雾剂获批上市,此为...

2026-06-17 21:36

新诺威名称变更为石药创新资讯

新诺威名称变更为石药创新

6月16日晚间,新诺威发布公告称,公司证券简称由新诺威变更为石药创新,证券代码“300765”保持不变,变更日期为2026年6月17日。

2026-06-17 09:13

第四届诺华中国患者日举办,照亮更有温度的患者支持生态资讯

第四届诺华中国患者日举办,照亮更有温度的患者支持生态

6月16日,第四届诺华中国患者日在上海成功举办。

2026-06-16 19:03

第106批仿制药参比制剂目录资讯

第106批仿制药参比制剂目录

经国家药品监督管理局仿制药质量和疗效一致性评价专家委员会审核确定,现发布仿制药参比制剂目录(第一百零六批)。

2026-06-16 16:18

武田制药公布Oveporexton新关键性研究数据资讯

武田制药公布Oveporexton新关键性研究数据

在第40届美国联合专业睡眠学会年会(SLEEP 2026)上公布的3期研究次要及探索性终点结果进一步显示,Oveporexton在广泛的日间及夜间症状方面带来改善

2026-06-16 12:58

兆科眼科硫酸阿托品滴眼液澳洲上市注册申请获受理资讯

兆科眼科硫酸阿托品滴眼液澳洲上市注册申请获受理

6月15日,兆科眼科发布公告称,公司就其用于减慢儿童近视加深疗法的硫酸阿托品滴眼液(0 02%剂量,产品代码:NVK002)提出的注册申请已获澳洲Therapeutic Goods Administrati...

2026-06-16 10:53

和铂医药和百图生科宣布联合成立AI医药公司资讯

和铂医药和百图生科宣布联合成立AI医药公司

6月15日,和铂医药和百图生科联合宣布,双方将建立全面战略合作伙伴关系,联合创立一家面向全球市场的新型AI管线研发公司MegaStream Techbio。

2026-06-16 10:25

陪审团认定安进故意侵权,和铂医药最高可获6060万美元赔偿资讯

陪审团认定安进故意侵权,和铂医药最高可获6060万美元赔偿

今日,和铂医药(02142 HK)发布公告,美国特拉华州联邦地区法院的陪审团就和铂医药针对安进公司(Amgen Inc )及其子公司Teneobio, Inc (以下合称“安进”)提起的专利侵...

2026-06-15 21:28

应对超重肥胖严峻挑战,辉瑞新一代GLP-1埃诺格鲁肽头对头研究验证临床优势资讯

应对超重肥胖严峻挑战,辉瑞新一代GLP-1埃诺格鲁肽头对头研究验证临床优势

超重与肥胖已是全球不可忽视的公共卫生挑战。

2026-06-15 19:58

年内创新药上市企业最大回购计划资讯

年内创新药上市企业最大回购计划

港股上述企业,中国生物制药(正大天晴为其旗下公司)今日发布公告,2026年6月12日,公司董事会决议通过一项股份购买计划,将视市场情况于未来12个月以不超过20亿港元总价在公开...

2026-06-15 15:56

拜耳研发开放日:共探医药创新未来资讯

拜耳研发开放日:共探医药创新未来

“拜耳研发开放日”活动近日在拜耳·亦庄开放创新中心举办。

2026-06-15 12:18