《海贼王》知识图谱

本项目内容包括数据采集、知识存储、知识抽取、知识计算、知识应用五大部分

【1】数据采集

本次项目主要采集构建了两个知识图谱和一个关系抽取数据集

  • 人物知识图谱:主要包含各个人物的信息
  • 关系抽取数据集:标注出自然语言中存在的实体以及他们之间的关系
  • 实体关系知识图谱:构建《海贼王》中各个实体之间关系的知识图谱

【2】知识存储

尝试使用了三元组数据库Apace Jena和原生图数据库Neo4j,并分别使用RDF结构化查询语言SPARQL和属性图查询语言Cypher,在知识图谱上进行查询。

【3】知识抽取

基于之间构建的关系抽取数据集,利用deepke中提供的工具进行关系抽取实践,测试了包括PCNN、GCN、BERT等模型在我们构建数据集上的效果

【4】知识计算

  • 图计算:在Neo4j上对实体关系知识图谱进行了图挖掘,包括最短路径查询、权威结点发现、社区发现等
  • 知识推理:在Apache Jena上对关系知识图谱进行了知识推理,补全了一部分的数据

【5】知识应用

  • 智能问答:基于REfO实现一个对于《海贼王》中人物的知识库问答系统(KBQA)。
  • 可视化图片:通过D3对实体关系图片进行可视化,并整合了人物知识图谱中的信息,进行展示。

数据与资源

其他信息

价值
https://github.com/mrbulb/ONEPIECE-KG
作者 曾浩
维护者 曾浩
最近更新 三月 16,2020,23:19(Asia/Shanghai)
创建的 一月 24,2020,10:49(Asia/Shanghai)