-
RJUA-QADatasets: 蚂蚁-仁济泌尿专科QA数据集
数据集概况 本数据集为基于医疗泌尿专科知识构造的QA推理数据集,由蚂蚁集团医疗大模型团队(AntGroupMed)与上海仁济医院泌尿科(RJU)专家团队合作研发,简称为RJUA-QA... -
浙江大学校史人物关系数据库
浙江大学在长期的办学过程中,以严谨的“求是精神”作为学风培养了大批优秀... -
中文糖尿病本体
具有细粒度语义关系与注释信息的中文糖尿病本体,并与SNOMED CT等英文本体建立了大量匹配信息。 -
GuwenEE:细粒度古汉语事件抽取数据集
面向古汉语领域事件抽取的数据集,原始数据是从《二十四史》中按篇随机选取而来,包含语料950条,事件Schema72个,包含事件1826个。 -
【科大国创最新发布】电信运营支撑领域术语库
电信运营商领域术语,分为一元组、二元组、三元组,现阶段公开3000条 -
国内行政区划知识数据
国内省市县乡村之间的行政区划数据。由于数据庞大,请自行到网盘提取。 提取码:2oc9 -
NOTAMkg.cn/dataset
本项目基于现有航行通告数据,构建航行通告事件要素实体与对应关系的知识图谱 -
百科知识图谱具有100W_en的实体
处理了同义词,添加了唯一性标签,基于neo4j导出的csv,不要使用office打开,会乱码的,使用程序提取更好一些。 链接:https://pan.baidu.com/s/1LhZ7YUKsHVhsfJIXZB9GhA?pwd=9m15 提取码:9m15 -
基于知识图谱的多模态类比推理数据集
ICLR2023“Multimodal Analogical Reasoning over Knowledge Graph”提出的数据集,包含一个多模态知识图谱数据集MarKG和一个多模态类比推理数据集MARS,用来评估模型的多模态类比推理能力。 -
中文多模态命名实体识别数据集
Wukong-CMNER,一个多模态NER数据集包含图像和文本的语料库。有55423个注释我们语料库中的图像-文本对。本数据是由华为发布的Wukong数据集标注得到,感谢华为公司允许对数据进行标注。 -
2022卡塔尔世界杯知识图谱
本项目计划构建2022卡塔尔世界杯中的各种实体(包括球员、国家队、俱乐部等)以及它们之间关系(包括人物与组织概念之间的从属关系以及人物关系等)的知识图谱。 -
《海贼王》知识图谱
本项目构建了动画《海贼王》知识图谱,以人物、职业、组织、种族为主要实体,并包含人物间关系,数据来源为Fandom海贼王中文版wiki和百度百科。项目步骤为:数据爬取与预处理,数据清洗和补充,人物关系知识抽取,可视化与知识问答。 -
名侦探柯南知识图谱及其问答
这是一个包含名侦探柯南中重要人物之间关系的知识图谱,其中包含有基础的知识图谱问答代码。 百度百科中对《名侦探柯南》系列相关人物和作品都有较为详尽的词条描述,本项目的知识主要来自于此网站。我们通过爬取百科词条,对所需知识内容进行提取。我们选用 neo4j 图数据库来存储我们的名侦探柯南人物关系知识图谱。... -
周杰伦歌曲知识图谱及在线查询系统
周杰伦(Jay... -
《倚天屠龙记》人物关系知识图谱
一个基于金庸武侠小说《倚天屠龙记》的人物关系三元组,包含了文中所有人物之间的主要关系,支持数据可视化。 -
工业信息安全知识图谱相关
包括1.网络安全等级保护基本要求,和ics相关的部分 2.美国工控漏洞数据集 3.cwe,cve,capec数据集 -
国内外TOP250电影作品知识图谱
我们基于国内外优秀影视作品,构建了一个关于其类型、主演、导演、上映时间的知识图谱。本项目运用了数据爬虫技术、深度抽取技术、知识图谱构建技术等关键技术,并在图谱上进一步实现了搜索、问答、挖掘等简单的应用。 -
imp知识图谱
imp数据构建三元组 -
鬼灭之刃知识图谱
本项目依据成员的兴趣,构建了动漫《鬼灭之刃》的知识图谱。本图谱的数据来源为Fandom鬼灭之刃wiki和萌娘百科鬼灭之刃的词条。项目构建了以人物、组织、技能为主要实体的知识图谱,实现步骤主要有以下几点: 通过爬虫爬取网页wiki上的半结构化数据和文字数据 对爬取的数据分别进行数据处理,半结构化数据直接转化为三元组,文字数据进行知识抽取... -
陈奕迅音乐作品知识图谱
2022年年末,陈奕迅的歌迷们终于盼来了在香港红馆举行的陈奕迅《FEAR AND DREAMS》演唱会,在此背景下,我们构建了陈奕迅音乐作品知识图谱,以便对陈奕迅演唱的作品进行更加深入的了解和分析。...