找到57个数据集

格式: JSON

过滤结果
  • 国内外TOP250电影作品知识图谱

    我们基于国内外优秀影视作品,构建了一个关于其类型、主演、导演、上映时间的知识图谱。本项目运用了数据爬虫技术、深度抽取技术、知识图谱构建技术等关键技术,并在图谱上进一步实现了搜索、问答、挖掘等简单的应用。
  • 希腊神话人物知识图谱

    基于百度百科及其他开放域数据作为语料来源,将神话人物名字作为主题关键词,通过爬虫爬取结构化数据作为知识图谱基本数据,并进行语义抽取构建了希腊神话人物关系的核心数据 在上述基础上,我们对数据进行半结构化,实体消歧(指爬虫的过程中选取希腊神话故事的人物),实体互补(指利用实体的亲属关系值的内容进行实体补充) 利用知识图谱实现了简单的知识问答
  • 基于cnScheme的外国文学研究领域知识图谱

    基于开放域数据CNKI的12833 篇研究文献作为语料来源,将文献中的关键词作为主题关键词,作者作为研究人员。通过爬虫爬取结构化数据作为知识图谱基本数据,结合爬取一些自然语言数据与半结构化数据,并进行语义抽取构建了外国文学研究领域的核心数据 在上述基础上,我们进行了实体对齐与部分的实体消歧,比如译名的对齐:列夫·托尔斯泰 和 托尔斯泰...
  • 医疗因果实体关系抽取数据集CMedCausal

    本数据集来源于CHIP2022医疗因果实体关系抽取学术评测任务:http://cips-chip.org.cn/2022/eval2 , 包括2,000段训练数据,2,000段测试数据。本数据集由阿里巴巴夸克医疗事业部和阿里云天池联合提供。
  • 医疗对话临床发现阴阳性判别数据集MDCFNPC

    本数据集来源于CHIP2021医疗对话临床发现阴阳性判别学术评测任务:http://cips-chip.org.cn/2021/eval1 , 数据集包括6,000段训练数据,4,000段测试数据。 本数据集由阿里夸克医疗事业部和阿里云天池平台联合提供。
  • 新冠疫情相似句对判定数据集

    新冠疫情相似句对判定数据集来自天池大赛:https://tianchi.aliyun.com/competition/entrance/231776/information
  • 中药说明书实体识别数据集TCM-NER 热门

    本数据集来源于天池中医药实体识别大赛:https://tianchi.aliyun.com/competition/entrance/531824/information。 数据来自中药药品说明书,通过挖掘中药说明书构建中药合理用药的知识图谱,将为中医规范诊疗奠定较好基础。抽取中药药品说明书中的关键信息可以帮助扩充中医药药品知识库。
  • 中医文献问题生成数据集TCM-QG 热门

    本数据集来自天池中医药问题生成大赛:https://tianchi.aliyun.com/competition/entrance/531826/information 。中医文献问题生成数据集包含3500篇语料,每篇文档由人工标注产生1~4对(问题, 答案)对。
  • 中文糖尿病科研文献实体关系数据集DiaKG 热门

    瑞金糖尿病知识图谱数据集,来源天池比赛:https://tianchi.aliyun.com/competition/entrance/231687/introduction
  • IREE:投资领域细颗粒度风险事件抽取数据集 热门

    A Dataset for Chinese Event Extraction in Investment Research 更新 20220703 论文已录用 20220604 双盲审稿暂时隐去作者及机构信息 背景介绍...
  • BODNews:面向商机挖掘的文档级中文新闻数据集 热门

    A Document-Level Chinese News Dataset for Business Opportunity Digging 更新 20220604 双盲审稿暂时隐去作者及机构信息 背景介绍...
  • FRMESE:细颗粒度风险主体抽取数据集

    A Fine-Grained Dataset for Chinese Event Subject Extraction in Financial Risk Management 更新 20220604 双盲审稿暂时隐去作者及机构信息 20220523...
  • 新冠多跳问答数据集 热门

    我们精心挑选了OpenKG-COVID19发布的知识图谱中的7个子图谱来构建关于新冠多跳问答数据集。我们对这些个子图谱进行了数据清洗,以及构建了有意义的多跳关系问题。这些知识包含了新冠肺炎疫情期间人们更关注以及日常生活中更容易问到的话题。
  • 魔兽世界人物信息知识图谱 热门

    《魔兽世界》(英语:World of Warcraft,缩写作...
  • 明代历史知识图谱

    项目设计并实现了明代历史知识图谱,涵盖了明代历史的重要人物、历史事件、历史地名、著作等若干实体,并实现了知识图谱的可视化展示。
  • 浙江大学校史人物关系数据库

    该项目使用基于bert的OpenKE工具从浙大校史文本中提取到了大量人物三元组知识,包括校史人物名、人物关系、职位、荣誉、所属机构、院系。文本信息来源于《名流浙大(百年求是)》、《图说浙大》、《浙江大学图史》。该项目采用Neo4j实现人物关系的可视化,并通过Cypher语言实现了简单的知识查询。
  • 英雄联盟职业和难度图谱

    本项目聚焦于构建英雄和其角色的实体关系知识图谱。其中实体包括英雄、角色;关系包括英雄与角色的关系(属于某一阵营)、英雄与英雄的关系(兄弟姐妹等)。并提供Database-free的图谱可视化界面和一个简单的智能问答系统。
  • 中国近代历史人物知识图谱

    中国近代历史涌现了大量的杰出人物和事迹,史料文献丰富,构成了一个庞大的知识体系。本项目旨在收集挖掘中国近代历史人物信息,构建人物及其相关实体的知识图谱,为历史资料的检索和研究工作提供帮助。...
  • 基于众包标注系统的文言文语言理解测评基准及数据集 热门

    C-CLUE是一个基于众包标注系统构建的文言文语言理解测评基准及数据集,由天津大学数据库课题组贡献。本次开源了由系统标注结果获取的近2万个实体以及4千多个关系,并处理分割成为训练集、校验集、测试集等文件,可供自然语言处理中命名实体识别和关系抽取任务直接使用。该基准及数据集能够为基于史书的历史知识图谱构建提供数据支持,以通过高度关联化数据的方式构造及展现...
您也可以使用应用程式界面 (看 API文献)注册.