首页  学报简介  在线投稿  投稿指南  编辑制度  编辑规范 
温馨提示:请作者按照论文模板修改...   (点击:) 05-20
学报编辑部组织召开提高办刊质量交...   (点击:) 12-04
编辑继续教育如何申报纳税专项附加...   (点击:) 11-27
常见的标题及其序号错误类型辨析   (点击:) 11-23
稿件中容易出错的245个成语   (点击:) 11-20
· 论文模板 07-07
· 自然科学论文作图常用参数 05-11
· 中图分类号 04-20
· 专家审稿回执单 04-13
· 北大中文核心期刊目录(第九版2021-... 01-16
国家新闻出版署 中国知网
中国新闻出版研究院 北大图书馆
中国高校科技期刊研究会 万方数据
科学出版社 超星数据库
12 HM-BERT:一种采用分级掩码的风电语音文本纠正方法
2024-03-06 11:38     (点击)

HM-BERT:一种采用分级掩码的风电语音文本纠正方法
HM-BERT: a correction method for voice to text conversion in the field of the wind power using hierarchical mask

高永兵,郑伟业,李春灿,姜春光

  • 1:内蒙古科技大学信息工程学院

  • 2:中冶西北工程技术有限公司市政设计研究院


摘要(Abstract):

采用一种基于分级掩码策略的文本纠正方法来提高语音识别后的文本质量.以风电相关的语音为数据集,将其通过公开的语音识别SDK转为文本数据,利用BERT中的MLM机制实现文本纠正,并采用分级掩码策略,针对不同的内容采用不同的掩码方法,改进后的模型称为HM-BERT.实验证明:HM-BERT在提升纠正效果的同时还加强了纠正模型的鲁棒性,该方法对其他领域的文本纠正也提供了解决思路.

关键词(KeyWords): BERT;MLM;分级掩码;语音文本纠正

基金项目(Foundation): 内蒙古自治区自然科学基金资助项目(2021LHMS06004)

作者(Author): 高永兵,郑伟业,李春灿,姜春光

DOI: 10.16559/j.cnki.2095-2295.2023.04.012


关闭窗口

地址:内蒙古包头市昆都仑区阿尔丁 大街7号   邮编:014010   电话:0472-5951610或0472- 5953910 Email:cky@imust.edu.cn  nkdxb@imust.edu.cn
版权所有:内蒙古科技大学学报编辑部(©2013)