找到4个数据集

机构: 清华大学

过滤结果
  • 清华大学-科技知识图谱

    SciKG是一个以科研为中心的大规模知识图谱,目前包含计算机科学领域,由概念、专家和论文组成。其中,科技概念及其关系是从ACM计算分类系统中提取出来的,并辅以每个概念的定义(大多数来自维基百科)。我们进一步使用AMiner将每个概念对应的顶尖专家和最相关的论文联系起来。每个专家包含职位、隶属机构、研究兴趣等属性,以及到AMiner系统的链接。每篇论文则...
  • XLORE双语百科知识图谱 热门

    XLore从异构的跨语言在线百科中抽取结构化信息,并将其分享在网络上。据我们所知,XLore是第一个大规模的中英文知识平衡的知识图谱。目前,XLore包含663,740个概念,56,449个属性和10,856,042个实例。这给构建任何双语言知识平衡的大规模知识图谱提供了一种新的方式。
  • 影视双语知识图谱 热门

    这是一个由清华大学计算机系知识工程实验室构建的完全结构化的双语影视本体, 共包括23个概念,91个属性,70余万个实体以及1000多万个三元组,其数据源包括LinkedIMDB,百度百科,豆瓣等。
  • THUOCL:清华大学开放中文词库

    THUOCL(THU Open Chinese Lexicon)是由清华大学自然语言处理与社会人文计算实验室整理推出的一套高质量的中文词库,词表来自主流网站的社会标签、搜索热词、输入法词库等。THUOCL具有以下特点: 包含词频统计信息DF值(Document Frequency),方便用户个性化选择使用。...
您也可以使用应用程式界面 (看 API文献)注册.