首页 > 最新目录 > 正文

15 基于BERT的中文电子病历命名实体识别

日期:2020-04-01 10:11:52 点击:

基于BERT的中文电子病历命名实体识别
Named entity recognition of Chinese electronic medical record based on BERT

李灵芳;杨佳琦;李宝山;杜永兴;胡伟健;

  • 1:内蒙古科技大学信息工程学院

  •  

摘要(Abstract):

电子病历中蕴含着丰富的医学信息,这些医学信息对疾病的诊疗具有十分重要的意义.利用命名实体识别技术对电子病历进行信息抽取已成为研究的热点之一,为了更加高效准确的抽取中文电子病历中的实体,提出了BERT-BiLSTM-CRF命名实体识别模型.模型在传统BiLSTM-CRF模型基础上,融合了BERT字嵌入模型,更好的结合文章上下文,充分考虑了一词多义等问题.实验结果证明,该模型在中文电子病历命名实体识别任务中取得了良好的效果,较现有命名实体识别方法,从准确率、召回率、F_1值3方面都有着明显的提升.电子病历命名实体识别任务准确度的提高,对进一步构建医学知识图谱、医学知识库等任务有着重大帮助.

关键词(KeyWords): 中文命名实体识别;BERT模型;中文电子病历;预训练语言模型

基金项目(Foundation): 国家自然科学基金资助项目(61661044,61961033);; 内蒙古自治区高等学校青年科技英才计划(NJYT-19-A15);; 优秀青年科学基金项目(2017YQL10);; 内蒙古自治区自然科学基金资助项目(2019MS06021)

作者(Author): 李灵芳;杨佳琦;李宝山;杜永兴;胡伟健;

Email:

参考文献(References):

地址:内蒙古包头市昆都仑区阿尔丁大街7号 邮编:014010 电话:0472-5951610或0472-5953910 Email:cky@imust.edu.cn nkdxb@imust.edu.cn

版权所有:内蒙古科技大学学报编辑部(©2013)