语音识别即通过麦克风捕捉用户发出的声音,将声波信号转换成机器可以处理的“发音特征”,再从发音和语言的“模型空间”中快速搜索最匹配的句子,即识别结果。语音识别过程就是一个模型匹配的过程,模型训练的好坏直接关系到系统识别的结果。
为了得到一个好的模型,往往需要有大量的原始语音数据来进行训练,特别是对于非特定人的语音识别系统来说,这一点显得更为重要。因此,在开始进行语音识别研究之前,首先要建立一个语音数据库。数据库包括不同性别、年龄、口音的说话人的声音,并且必须具有代表性,能均衡地反映实际使用情况。模型训练就是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数。
目前在医学领域并没有专门的语音识别词库和模型。由于医学术语、药物名称、疾病名称等用词的专业性很强,识别率会大幅下降。我带领团队花费了7个月的时间,分别于iOS平台和Android平台,采用科大讯飞和云之声两个主流第三方SDK,对药品词库的36176个药品名称和疾病词库的23501个疾病名进行了测试,训练出错率较高的词汇,初步搭建了医学语音识别领域的第三方素材库,并决定免费开放给任何有志于开发移动医疗APP的创业团队和个人。
下面以Android为例,具体介绍我们构建体系的流程、标准和测试方法,以帮助各位移动医疗开发人员快速上手:
测试平台:2台android4.0系统手机(小米2、中兴U930HD)、珍立拍系统、科大讯飞SDK
小 组: A组和B组
测试方法:对所有药品和疾病名称进行反复测试,使用纠正训练法,来克服语音识别体系中HMM的训练效果。小组A测试药品,小组B测试疾病,普通话识别。
测试步骤:
1. 医学词汇约有数十万条,前期总结查找筛选最常用词汇并分组。
2. 使用珍立拍系统中的语音识别对所有词库进行第一遍测试。
3. 在第一遍测试的基础上,对筛选出来错误的词汇进行二次测试,再次筛选。
4. 总结出识别易错词汇,两组交叉测试后,随后交给程序人员,按科大讯飞SDK模型训练,输入相应代码,完善建库。
可能存在的影响因素:
1. 读错:由于医学词汇中有很多较为生僻的汉字,读错很难避免,很多医生即使会写这个词,但是发音也可能会错。
规避方法:遇到拿捏不准的汉字时,查找准确读音,尽量避免错误。
2. 环境因素:测试时,所处的环境存在噪音。
规避方法:选择在低噪音环境中测试,但不能完全于安静的环境中测试,因其与日常使用环境不符。
3. 汉字的同音字:例如“弱视”“荨麻疹”,识别结果“若是”“寻麻疹”。
4. 汉字尾音:例如“肝癌”,识别结果为“刚来”。
5. 实际发音影响:例如“阻生齿”,识别结果“主生殖”。
下面以疾病词汇举例:
测试小结:
由统计结果可以看出,疾病名的识别率高于药品名。笔者分析,造成此结果的原因在于,疾病名的广普率要高于药品名,所以各个语音识别公司比较重视,而且疾病生僻汉字较少,而药品种类要远多于疾病种类,其中生僻汉字也较多。二次测试的正确率较一次测试大约提升了一个百分点左右,还是可以适当减少错误数据库中的词汇量。
音节短的词出错率较高,如:单音节词,痣(识别结果“志”),双音节词,义眼(识别结果“一眼”),长音节词出错率低,原因可能是音节越短的词,其同音节的普通词较其更常见,而且如果其尾音特殊的话,影响较大。
针对医学专业词汇识别率低的问题,目前可使用以下三种解决办法:
一、 扩充自定义词库
虽然有用户词表,但是目前科大讯飞用户词表仅限数量2000,经沟通后他们正在扩大词汇表数量中。但如果数据过大,将会导致数据包过重的问题,而移动端由于存储和运算能力受限,所以无法满足数量庞大的整个医学词库,因此我们只能先做常用库。
二、 搭建第三方素材库
语音识别虽然在实用性上已得到很大提高,但是由于目前语音识别的单一性(只能单纯的识别中文或者英文),以及使用环境、语音差异化等因素的影响,容易造成识别错误。就这些因素而言,我们为此做了大量的基础工作,用于搭建第三方数据库,在尽可能排除其它干扰因素的情况下,检测出识别错误的词汇,也为下一步构建专业领域的识别模型搭建出了样本数据库(针对大量样本数据库,精简出识别错误的小样本数据库,减少模型训练词库)。
三、 构建专业领域的识别模型
对于有大量专业词汇的识别系统来说,使用模型训练可以有效提升识别率,目前模型训练比较常用的有四种方法:最大似然估计、纠正训练法、最小分类错误、最大互信息方法。模型训练需要专业的技术,并与语音识别公司进行合作,由企业提供词库信息和语音集,专业人员采用模型训练对需要识别的词库进行训练,最终给出个性化定制的识别模型,以提升识别率。
语音识别技术在移动医疗领域中的应用会越来越普遍,但还有大量的基础工作需要我们大家齐心协力去完成。希望业内的精英之士能够对此多交流,多合作,抛开一些利益的纠葛,共同为行业的发展贡献出自己的力量。
来源:健康界
为你推荐
资讯 百度健康计划近期推出DoctorClaw
据悉这是一款面向医生的OpenClaw,定位是医生AI助理,可以帮医生自动整理研究资料、跟踪论文进度、设置随访提醒、定时追踪最新文献等。
2026-03-18 11:45
资讯 传奇生物被传拟赴港上市
日前有媒体报道引述知情人士称,传奇生物拟赴港上市,最早将于今年(2026年)落地,募资规模约3亿至4亿美元(约折合港元23 4亿至31 2亿)。对此,3月17日,传奇生物方面表示,...
2026-03-17 13:20
资讯 男子回家遭自家狗撕咬,伤口深可见骨!专家紧急提醒:暴露后规范处置是关键
狂犬病是由狂犬病病毒引起的一种以侵犯中枢神经系统为主的急性人兽共患传染病。其主要临床表现为特异性恐风、恐水、咽肌痉挛、进行性瘫痪等。
2026-03-17 12:42
资讯 蚂蚁阿福全面接入中华医学会杂志社知识库
近日,中华医学会杂志社与蚂蚁健康战略合作迎来新进展:蚂蚁阿福已全面接入中华医学会杂志社的医学文献知识库,阿福问答功能可引用知识库内最新的临床指南、专家共识和医学文献。
2026-03-17 11:24
资讯 佰特微医疗完成近亿元B轮融资,加速外周血管介入与心衰领域创新布局
本轮融资由天士力资本领投,勤智资本跟投,凯乘资本担任独家财务顾问,所募资金将主要用于新产品研发、生产基地建设及市场拓展,进一步加速公司在外周血
2026-03-16 19:46
资讯 天鹜科技完成超2亿元A+轮融资,加速AI蛋白质设计产业化落地
本轮融资由中国石油昆仑资本、上海未来产业基金及老股东涌铧投资联合领投,国投招商、新供销基金、法默凯、孚腾资本等机构跟投,老股东启明创投、金沙江联合资本润璞医疗基金、...
2026-03-16 19:42
资讯 CDE:以生物发酵来源的多肽类制剂为对照药品研发、全化学合成法制备的多肽类制剂,应如何申报临床试验申请和上市申请?
如境内外均无全化学合成法制备的同品种上市的,申请人可参照化学药品2 2类申报。
2026-03-16 16:32
资讯 Cytiva发布重磅新品及本土新品牌“瑞予”, 助推中国创新疗法实现全球引领与普惠可及
Cytiva在华发布三款重磅产品与创新解决方案,赋能体内细胞治疗、个性化肿瘤疫苗、新型抗体等创新疗法的研发与生产。
2026-03-16 13:26
资讯 正式发布的“十五五”规划纲要中的“医药健康”
3月13日,《中华人民共和国国民经济和社会发展第十五个五年规划纲要》发布,明确了2026-2030年我国经济社会发展的战略方向,医谷网现将“医药健康”相关辑录如下。
2026-03-14 21:37
资讯 成人阻塞性睡眠呼吸暂停诊治指南(2025)发布会暨OSA个体化治疗研讨会在京圆满召开
2026年3月13—14日,由《中华医学杂志》社有限责任公司、《中华结核和呼吸杂志》编委会主办的“成人阻塞性睡眠呼吸暂停诊治指南(2025)发布会暨OSA个体化治疗研讨会”在北京圆满召开。
2026-03-14 18:21
资讯 全球首个侵入式脑机接口医疗器械获批上市
今日,国家药监局发布消息,国家药监局批准了博睿康医疗科技(上海)有限公司植入式脑机接口手部运动功能代偿系统创新产品注册申请,实现脑机接口医疗器械全球首发上市,标志着...
2026-03-13 17:39
资讯 康龙化成与礼来达成口服GLP-1小分子药Orforglipron生产合作协议
3月11日晚间,康龙化成官方微信发布消息,康龙化成与礼来公司共同宣布,达成关于首个申报注册的口服小分子GLP-1受体激动剂Orforglipron的生产合作协议。
2026-03-12 21:56
资讯 美国 FDA 批准颂狄多(氘可来昔替尼)用于治疗活动性银屑病关节炎成人患者
颂狄多是一种口服选择性酪氨酸激酶 2(TYK2)抑制剂,也是首个获批用于 PsA治疗 的 TYK2 抑制剂
2026-03-12 16:53










