图谱

  • 面向试验鉴定的命名实体识别任务

    本次评测任务依托Biendata平台展开,将采取刷榜的方式,验证集发布后,允许参赛队伍每天至多向平台提交一次结果,格式与任务描述中的示例输出相同,取四个预定义类各自F1值的算数平均值,作为排名依据,排名每小时更新一次。参赛队伍可在测试集发布之前随时上传验证集的计算结果,平台管理系统会及时更新各队伍的最新排名情况,验证集榜不计入比赛最终成绩。...
  • OpenKG 精选文章汇编(2020 年度)

    2020 年我们总共分享了 144 篇文章,其中原创文章 69 篇,内容涵盖了知识 图谱的方方面面,包括开源开放、领域应用、技术动态、论文浅尝、会议研讨等 多个主题。截止目前,公众号总订阅数已达 3.1 万人,全年累计阅读量达 58 万 +,累计阅读人数达 41 万+。 今年的汇编我们分解为“论文浅尝”、“开源开放”和“技术前线” 三个...
  • 新冠开放知识图谱.百科 热门

    新冠百科(包括病毒、细菌、流行病、传染病等)。一个领域百科KG,这是基础;从各大百科出发,也会涵盖之前几次疫情涉及到的知识点。 图谱以病毒,细菌为主体,扩展了治疗,疾病相关内容,通过了这些概念的百科知识,形成新冠百科知识图谱。 潜在应用:面向新冠相关术语的语义检索、智能问答,并可用于新冠相关文档的智能搜索和推荐。...
  • 新冠开放知识图谱.科研 热门

    简介更新: 1.病毒分类图谱 v2.0,根据最新 ncbi 网站内容更新了病毒族系相关的科研基础数据,包括了所有病毒的 lineage 分类信息。 2.新冠基本信息图谱 v1.0, 从新冠病毒的基因蛋白,宿主等相关信息出发构图。 3.抗病毒药物图谱 v1.0,依据 drugbank...
  • 新冠开放知识图谱.健康 热门

    新冠健康图谱包含跟新冠肺炎相关的各类疾病、药物、症状、检查、全国各地接收新冠肺炎定点医院等信息。 潜在应用: 流行病调查研究,基于图谱的新冠肺炎健康防护问答。
  • 新冠开放知识图谱.概念 热门

    新冠概念图谱从网络文本中采集了与新冠疾病相关的实体和关系(包括疾病、人物、症状等),进一步融合了从百度百科,维基百科等知识库的infobox中提取的实体关系。更为特别的是,本概念图谱利用自动挖掘的手段从网络文本中采集了大量细粒度的上位概念词。即此概念图谱的is-a层次结构(schema)是自动构建而成的,包含了细粒度的上下位层次结构。该概念图谱目前已应...
  • 新冠开放知识图谱.流行病 热门

    新冠肺炎流行病学知识图谱包含了流行病学知识图谱Schema和基于此Schema定义的新冠肺炎资源实例。其中流行病学知识图谱Schema重点刻画流行病学的基本概念、流行病学调查等内容,未包含“流行病学研究方法”、“预防与控制策略”、“临床治疗与预后”等内容,需要在后续版本中与其他新冠肺炎知识图谱集成或连接。新冠肺炎资源实例包含了发生在2019年~2020...
  • 新冠开放知识图谱.临床 热门

    从诊疗规范(流行病学+症状+实验室指标+治疗);研究进展(测序、药物开发、疫苗);发病统计(丁香园)出发, 研究进展与科研关联,从目前已有的规范文件入手出发。 图谱以2019冠状病毒病(COVID-19)为核心延展至病毒、治疗方案、症状、方剂等各类概念,形成新冠临床知识图谱,可基于图谱进行知识问答。
  • 新冠开放知识图谱.英雄 热门

    涉及到专家组、武汉当地和全国各地相关的KOL等,涉及生平事迹和基本属性等,并与新冠百科、新冠科研、新冠临床、新冠防控等中的一些概念或实体关联。 图谱以新冠病毒专家为核心延展至履历、成果、事件、战役等各类概念,形成新冠英雄知识图谱,可基于图谱进行英雄人物动态展示。
  • 新冠开放知识图谱.防控 热门

    根据目前互联网公开的针对人员、场所、交通工具防控指南或手册,形成相应的知识图谱,包含防护概念的分类体系、注意事项,相关避免去的场所和不要做的事情。 其中物资包含口罩等涉及一些特定商品的图谱并与防控规则关联。 潜在应用包括提供基本防控知识问题,集成于流程化信息处理平台,用于各场所检查防控措施是否正确等。
  • 新冠开放知识图谱.物资 热门

    新冠物资图谱包含防控新型冠状病毒所需要的各类物资,主要包括医用防护装备、日常防护用品、医用诊疗设备以及治疗用药。其中,医用防护装备包含了医用手套、口罩、隔离服等;日常防护用品包含洗手液、消毒用品等;医用诊疗设备包含常规检查设备和氧疗设备;治疗用药包含了《新型冠状病毒感染的肺炎诊疗方案》多个版本中的中、西药品。
  • 《大词林》开源75万核心实体和围绕核心实体的细粒度概念、关系列表

    开源了《大词林》中的75万的核心实体,和该核心实体对应的细粒度概念词(共1.8万概念词,300万实体-概念元组),及相关的关系三元组(共300万)。这75万核心实体列表涵盖了常见的人名、地名、物品名等术语。概念词列表则包含了细粒度的实体概念信息。借助于细粒度的上位概念层次结构和丰富的实体间关系,本次开源的数据能够为智能服务系统,例如问句相似度计算、智能...
  • OpenKG论文浅尝2019年论文汇编

    OpenKG「论文浅尝」旨在通过分享近期知识图谱领域的论文笔记,内容涉及信息抽取、知识推理、知识问答、推荐系统、知识融合等多个方向。2019年共推送 90 篇「论文浅尝」,这本论文汇编是根据文章阅读量挑选出的其中20+篇笔记。 特别感谢:整理「论文浅尝」笔记的来自浙江大学、东南大学、南京大学、天津大学、复旦大学的 40 多位同学。
  • BTC2019数据集: Billion Triple Challenge 2019 Dataset 热门

    BTC数据集是从2018/12/12到2019/01/11使用LDspider进行大规模RDF爬取的数据,数据以四元组的形式存储,第四个元素编码相关联的三元组从web文档解析的位置。数据集包含了2,155,856,033个四元组,从394个付费级域中的2,641,253个RDF文档中收集。把数据合并到一个RDF图中会产生256,059,356个不同的三...
  • OMAHA七巧板医学术语集样例数据 热门

    开放医疗与健康联盟(Open Medical and Healthcare Alliance,OMAHA)基于本体论构建了一套中文临床医学术语集。涉及领域包括疾病诊断、症状、检验检查、基因、基因突变等,术语集包括概念、术语、关系(子类关系和属性关系)和映射四大核心构件。目前已积累76万概念,100万术语,254万关系。...
  • 唐诗别苑--基于知识图谱的全唐诗语义检索与可视化平台 热门

    功能一:语义检索——“没有你找不到的唐诗” 1.查询诗人信息或作品,可输入其名字或别号 2.查询诗人交友状况 3.查询诗歌地点、风格、主题、题材、意象、教学阶段等信息,可输入相关标签或将其组合 功能二:知识图谱可视化——“原来唐诗可以这么玩” 1.动态诗人社交网络:一眼看到谁是社交小王子 2.诗人迁徙游历图:唐代最厉害的驴友是谁?等待你来挖掘...
  • Synonyms:一个开源的中文近义词工具包

    Synonyms是Hai Liang Wang 和胡小夕在 GitHub 开放了一个中文近义词工具包,它可用于如文本对齐、推荐算法、相似度计算、语义偏移、关键字提取、概念提取、自动摘要、搜索引擎等很多 NLP 任务。该工具包目前能搜索近义词和比较语句相似度等任务,且词汇量达到了 125,792。
  • 清华大学开源OpenKE: 知识表示学习平台 热门

    OpenKE 是一个开源的知识表示学习平台,由 THUNLP 基于 TensorFlow 工具包开发。在 OpenKE 中,我们提供了快速和稳定的工具包,包括最流行的知识表示学习(knowledge representation learning,KRL)方法。该框架具有容易拓展和便于设计新的知识表示学习模型的特点。 该框架有如下特征: -...
  • 基于elasticsearch的KBQA实现及示例 热门

    这是一个基于ElasticSearch实现的简单的基于知识库的问答系统。该问答系统可以解析输入的自然语言问句生成ES查询,然后执行得到结果。目前实现了按照名称检索实体,实体属性,多跳检索,以及检索符合多对属性要求的实体。
  • 基于 REfO 的 KBQA 实现及示例 热门

    这是一个基于 Python 模块 REfO 实现的知识库问答初级系统. 该问答系统可以解析输入的自然语言问句生成 SPARQL 查询,进一步请求后台基于 TDB 知识库的 Apache Jena Fuseki 服务, 得到结果. 这是一个入门级的例子. 内含介绍此项目的 README.pdf. 方便用户快速把握这个项目的想法. 希望用户体会默认的 3...
  • 基于limes的中文知识图谱融合实战演练教程 热门

    Limes使用教程和数据集
  • 国内主要中文百科知识图谱之间的链接数据集 热门

    链接的中文百科知识图谱是OpenKG正在从事的一项工作。目的是促进百科类、通用域的知识图谱的开放与互联。目前已经初步建立了国内几个主要中文开放百科类知识图谱的链接,这包括Zhishi.me(狗尾草科技、东南大学)、CN-DBPedia(复旦大学)、XLore(清华大学)、Belief-Engine(中科院自动化所)、PKUPie(北京大学)、ZhOnt...
  • 中文百科知识图谱Zhishi.me-提供Dump 热门

    这是中文百科知识图谱zhishi.me的dump,分为turtle格式和json-ld格式两个版本
  • KB2E: 清华大学知识图谱embedding工具包 热门

    此工具包中实现了目前效果较好的知识表示学习的方法,包括TransE, TransH, TransR and PTransE等,并且已在数据集FB15K和WN18上测试。
  • Limes:实体链接发现框架

    OpenKG搜集和整理知识图谱相关的技术工具,并将组织开展技术评测。 Limes是一个基于度量空间的实体链接发现框架,结合了数学统计,前缀后缀,位置过滤来计算相似率。这个相似率用来过滤掉不符合匹配条件的实体对,以此减少比较时间复杂度,提高效率。
  • dedupe: 知识链接python库

    OpenKG搜集和整理知识图谱相关的技术工具,并将组织开展技术评测。 dedupe是一个用于fuzzy matching, record deduplication 和 entity-resolution的python库。它基于active...
  • THULAC:清华大学中文词法分析工具包 热门

    THULAC(THU Lexical Analyzer for Chinese)由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包,具有中文分词和词性标注功能。THULAC具有如下几个特点: 能力强。利用我们集成的目前世界上规模最大的人工分词和词性标注中文语料库(约含5800万字)训练而成,模型标注能力强大。...
  • THUOCL:清华大学开放中文词库

    THUOCL(THU Open Chinese Lexicon)是由清华大学自然语言处理与社会人文计算实验室整理推出的一套高质量的中文词库,词表来自主流网站的社会标签、搜索热词、输入法词库等。THUOCL具有以下特点: 包含词频统计信息DF值(Document Frequency),方便用户个性化选择使用。...
  • 城市内涝语义数据 热门

    提供结构化的城市内涝数据,外链至气象、交通、微博等数据。 目前提供十个城市的数据。
  • OneM2M基础本体-BaseOnto 热门

    OneM2M是2012年成立的目前全球最主要的物联网标准化组织。OneM2M致力于物联设备在业务层的(而非通信层)的互联互通工作。其中的一项重要工作是设备之间的语义互操作标准。并为此制定了M2M基础本体。这里提供该本体的中文版本及中文说明文档。