消防科学与技术 ›› 2023, Vol. 42 ›› Issue (11): 1529-1534.
关斯琪1,2,3, 董婷婷1,2,3, 万子敬1,2,3, 何元生1,2,3
Guan Siqi1,2,3, Dong Tingting1,2,3, Wan Zijing1,2,3, He Yuansheng1,2,3
摘要: 为实现火灾事故调查档案的关键信息抽取,提出一种基于BERT-CRF模型的文本命名实体识别方法。通过对161篇事故报告进行实体标注及数据增强,构建了火灾事故文本语料集;基于BERT预训练模型,对语料集中的句子序列进行双向特征提取,深度挖掘事故文本上下文的语义信息;结合CRF模型,充分考虑标签转移规则,对关键实体进行预测。试验表明:本文方法在火灾事故案例实体识别任务中的精确率、召回率以及F1值分别为76.36%、86.19%、80.97%,优于BERT和BERT-BiLSTM-CRF模型,且训练时长较BERT-BiLSTM-CRF模型缩短61 s。本文方法可为火灾调查知识库、案卷编制等下游系统提供准确的实体构建服务。