TTKG-Math:数学模板定理知识图谱
TTKG-Math(Template-Theorems Graph for Math)是一套面向数学推理的“模板—定理”图谱/知识库:它借鉴人类解题的联想机制,将具体数学题抽象为可复用的问题模板与分步的解法模板,并把每一步所需的关键定理/规则与模板建立显式链接,从而在遇到新题时能先做“问题蒸馏”得到模板表征,再在图中检索最相关的模板与定理作为上下文输入给 LLM,提升复杂数学题的定理召回与应用能力,并在多数据集上验证了准确率与效率的综合收益。
MolSafeKG:化学安全知识图谱
MolSafeKG 汇总了三种主要类型的信息:分子实体、结构特征以及安全性标注。分子实体的集合包含了从权威来源中精选出的 83,925 种独特的化合物。对于结构特征,我们编码了丰富的化学子结构信息,包括来自元素周期表的 117 种化学元素、149 种分类为 13 类的官能团以及从 ChEMBL 数据库中提取的 434 个结构警报。对于安全性标注,我们纳入了涵盖三大类(物理、健康和环境风险)的 68 个全球统一制度(GHS)危害陈述,以及在药物开发中通常评估的 8 个关键毒性指标。
PorousKG:多孔材料知识图谱
PorousKG 数据集主要面向多孔材料领域的知识抽取与知识图谱构建,核心语料来源于 32,000 余篇多孔材料相关的全文学术文献,并融合 剑桥结构数据库(CSD) 中的金属—有机框架(MOF)结构数据,以及 量子计算优化的 QMOF 数据库等权威结构化资源,形成“文献证据 + 结构数据 + 计算数据”互补的综合数据基础。数据覆盖多孔材料关键表征与性能信息,包括 比表面积、孔隙率、吸附性能 等核心指标及其上下游实验条件与分析结论。文献来源以高水平期刊与会议论文为主,文本同时包含实验过程描述、理论模拟设定与性能机理分析等多种表达形态;相较于单一结构化数据库,语义更专业、信息更分散且隐含性更强,从而对实体识别、关系抽取、属性标准化与跨源融合一致性提出更高要求。
AAKG:氨基酸知识图谱
AAKG(Amino Acid Knowledge Graph)是面向蛋白质工程的氨基酸知识图谱,基于 AAontology 汇聚并结构化刻画 20 种天然氨基酸的多维理化属性与内在关联:在图谱中同时建模氨基酸实体与属性实体(如极性、体积等),并通过 rdftype 与对象属性组织类层级与属性数值,从而让不同氨基酸可经由属性节点建立可解释的间接联系。进一步地,AAKG 用跨属性的绝对差异来度量氨基酸间的理化相似性,并将相似性排序作为边权,以形成可用于下游策略搜索与推理的氨基酸关系网络。
ProteinKG65:多模态蛋白质知识图谱
ProteinKG65 是一个多模态蛋白知识图谱数据集,将蛋白实体与 GO 术语实体对齐到对应的蛋白序列与文本描述。数据规模约 61.4 万实体、562 万三元组,以 Protein–GO 注释关系为主,并包含 GO–GO 关系,覆盖 GO 的三大分支(MF/CC/BP)。为缓解长尾分布,数据将部分高频关系细化扩展至 65 类,并提供 transductive 与 inductive 两种标准划分,适用于蛋白功能预测与知识推理等任务。
ElementKG 2.0:开源化学知识图谱
ElementKG 2.0模拟化学家的认知逻辑闭环,以“元素-官能团-分子-反应-实验”为主线,构建覆盖化学反应全过程的统一知识表达框架。数据集旨在重构目前化学数据的组织维度,为面向自驱动化学实验室的智能体提供知识底座,促进计算化学与湿实验的衔接。ElementKG 2.0涵盖超过100万条化学反应与实验流程,超过1000万个化学物质。
ElementKG 1.0:化学元素知识图谱
ElementKG 数据集面向材料与化学领域的元素知识建模与推理需求,系统化汇聚了元素的结构化先验知识,包括元素的基础属性(如原子序数、原子量、价态/电负性等)、周期表层级关系(族/周期/类别等)以及元素间可解释的关联与约束关系。数据以可计算的知识图谱形式组织,支持元素表示学习、组成/性质预测、材料设计与分子生成等任务中的知识增强 (如检索增强、约束生成、语义提示与可控数据增强),从而为模型提供可审计、可扩展的科学先验与推理依据。
StarRailKG:《崩坏:星穹铁道》(个人)
《崩坏:星穹铁道》是米哈游开发的一款星际冒险主题回合制角色扮演游戏,自 2023 年上线以来积累了大量游戏角色、装备及其相关数据。本项目旨在构建一个基于知识图谱技术的游戏信息检索与问答系统,通过对游戏相关实体及其关系的系统化建模,实现对角色、光锥(武器装备)、材料、命途(角色路径分类)、阵营等游戏要素的智能化查询与分析。
鸡尾酒配方(个人)
数据集包括396款鸡尾酒的配方,制作方法,使用杯型,制作步骤等信息。 数据源:喝点鸡尾酒”网站(enjoycocktail.com)。
推理时知识融合框架:KGA(Knowledge Graph-guided Attention)(东南大学)
KGA: Inference-Time Knowledge Graph Fusion by Rewiring Attention for Adaptive Information Aggregation
