找到9个数据集

格式: RAR

过滤结果
  • 菜谱知识图谱

    项目设计并实现了菜谱领域的知识图谱,经过数据采集、清洗、存储构造知识图谱,并基于知识图谱实现了简单的可视化与问答系统。
  • Bilibili知名up主知识图谱

    Bilibili,全称为哔哩哔哩弹幕网,亦称哔哩哔哩、bilibili弹幕网,或简称为B站,是一个以ACG相关內容起家的弹幕视频分享网站,其前身为视频分享网站Mikufans,该网站由网友“bishi”(徐逸)于2009年6月26日创建。Mikufans建站的初衷是为用户提供一个稳定的弹幕视频分享网站,网站于2010年1月24日改为现名。...
  • DiseaseKG:基于cnSchma常见疾病信息知识图谱

    本项目根据从权威医药网站上爬取的医疗数据,对数据进行处理,从而运用到中文开放知识图谱(OpenKG.cn)中,以便需要者直接使用。对获得的医疗数据进行整理,使其可直接用于知识图谱的搭建(Neo4j),文件处理成json格式。文件分为实体(实体基本信息与属性)和关系(不同实体间关系)两个类别。...
  • 坦克世界(World of tanks)-坦克关系类别知识图谱

    简介 根据坦克世界官方网站提供的API使用手册,编写了坦克属性爬取脚本,获得共679辆坦克的信息,其中坦克歼击车(Tank Destroyor)128辆、重型坦克(Heavy Tank)148辆、轻型坦克(Light Tank)147辆、中型坦克(Medium Tank)204辆、自行火炮(Self-Propelled Gun)52辆。 属性...
  • 图书问答知识图谱

    图书知识图谱包括图书(books)、人(person)、出版社(press)三类实体,属性包括标题(title)、评分(rating)、作者(writer)、翻译者(translator)、出版信息(pub_info)、序列号(series)、标签(tags)、国籍(country)等,同时包含图书和人之间的被翻译关系(translateBy)、图书和...
  • 面向试验鉴定的命名实体识别任务

    本次评测任务依托Biendata平台展开,将采取刷榜的方式,验证集发布后,允许参赛队伍每天至多向平台提交一次结果,格式与任务描述中的示例输出相同,取四个预定义类各自F1值的算数平均值,作为排名依据,排名每小时更新一次。参赛队伍可在测试集发布之前随时上传验证集的计算结果,平台管理系统会及时更新各队伍的最新排名情况,验证集榜不计入比赛最终成绩。...
  • 《大词林》开源75万核心实体和围绕核心实体的细粒度概念、关系列表

    开源了《大词林》中的75万的核心实体,和该核心实体对应的细粒度概念词(共1.8万概念词,300万实体-概念元组),及相关的关系三元组(共300万)。这75万核心实体列表涵盖了常见的人名、地名、物品名等术语。概念词列表则包含了细粒度的实体概念信息。借助于细粒度的上位概念层次结构和丰富的实体间关系,本次开源的数据能够为智能服务系统,例如问句相似度计算、智能...
  • 英文抗生素药物医学知识图谱IASO1.0版 热门

    近日,由北京大学互联网信息工程研发中心(CIRE)开发的中文医学知识图谱英文抗生素药物医学知识图谱IASO1.0发布,面向公众正式开放试用。IASO是利用自然语言处理与文本挖掘技术,基于大规模医学文本数据,以人机结合的方式研发的英文药物医学知识图谱。...
  • OMAHA七巧板医学术语集样例数据 热门

    开放医疗与健康联盟(Open Medical and Healthcare Alliance,OMAHA)基于本体论构建了一套中文临床医学术语集。涉及领域包括疾病诊断、症状、检验检查、基因、基因突变等,术语集包括概念、术语、关系(子类关系和属性关系)和映射四大核心构件。目前已积累76万概念,100万术语,254万关系。...
您也可以使用应用程式界面 (看 API文献)注册.