66 / 2024-06-30 21:19:43
面向生物安全的高风险病原体知识图谱构建及对比研究
高风险病原体;生物安全;领域知识图谱;联合抽取
终稿
吴旻 / 国防科技大学系统工程学院
蔡梦思 / 国防科技大学系统工程学院
牟建红 / 国防科技大学系统工程学院
卜天赐 / 国防科技大学系统工程学院
谭索怡 / 国防科技大学系统工程学院
吕欣 / 国防科技大学系统工程学院
高风险病原体是威胁人类生命健康的主要因素之一,由高风险病原体引发的生物安全事件已严重影响了人类社会稳定,对高风险病原体生物安全防控进行系统的研究已成为必然。本文面向开源数据,提出一种基于大规模病原体生物安全防控数据的知识图谱构建方法。首先,分别使用Scrapy爬虫框架和OCR技术收集相关网站和电子书籍中相关的病原体数据,进行数据处理后形成高风险病原体生物防控语料库。然后,根据需求定义实体类型和关系类型,构建高风险病原体生物安全防控本体。其次,基于本体特点标注高风险病原体生物安全防控数据集,并运用CasRel、OnRel和PRGC三种联合抽取算法在该数据集上进行知识抽取实验,实验结果表明PRGC的抽取效果最佳且F1值达到69.54%。此外,本文对PRGC算法进行了改进,并在BERT模型上进行了专业语料库的再次预训练,改进的知识抽取算法的F1值达到75.48%,在高风险病原体生物安全防控数据集的提升率达到8.54%。之后,基于文本相似度对病原体数据进行基于文本相似度的知识融合,形成了面向生物安全的高风险病原体知识图谱。最终,将知识图谱导入了Neo4j图数据库中,实现了知识图谱的可视化及相关知识的查询功能。
重要日期
  • 会议日期

    08月02日

    2024

    08月04日

    2024

  • 08月04日 2024

    注册截止日期

主办单位
国防科技大学系统工程学院
联系方式
历届会议
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询