AAKG:氨基酸知识图谱
AAKG(Amino Acid Knowledge Graph)是面向蛋白质工程的氨基酸知识图谱,基于 AAontology 汇聚并结构化刻画 20 种天然氨基酸的多维理化属性与内在关联:在图谱中同时建模氨基酸实体与属性实体(如极性、体积等),并通过 rdftype 与对象属性组织类层级与属性数值,从而让不同氨基酸可经由属性节点建立可解释的间接联系。进一步地,AAKG 用跨属性的绝对差异来度量氨基酸间的理化相似性,并将相似性排序作为边权,以形成可用于下游策略搜索与推理的氨基酸关系网络。
ProteinKG65:多模态蛋白质知识图谱
ProteinKG65 是一个多模态蛋白知识图谱数据集,将蛋白实体与 GO 术语实体对齐到对应的蛋白序列与文本描述。数据规模约 61.4 万实体、562 万三元组,以 Protein–GO 注释关系为主,并包含 GO–GO 关系,覆盖 GO 的三大分支(MF/CC/BP)。为缓解长尾分布,数据将部分高频关系细化扩展至 65 类,并提供 transductive 与 inductive 两种标准划分,适用于蛋白功能预测与知识推理等任务。
ElementKG 2.0:开源化学知识图谱
ElementKG 2.0模拟化学家的认知逻辑闭环,以“元素-官能团-分子-反应-实验”为主线,构建覆盖化学反应全过程的统一知识表达框架。数据集旨在重构目前化学数据的组织维度,为面向自驱动化学实验室的智能体提供知识底座,促进计算化学与湿实验的衔接。ElementKG 2.0涵盖超过100万条化学反应与实验流程,超过1000万个化学物质。
ElementKG 1.0:化学元素知识图谱
ElementKG 数据集面向材料与化学领域的元素知识建模与推理需求,系统化汇聚了元素的结构化先验知识,包括元素的基础属性(如原子序数、原子量、价态/电负性等)、周期表层级关系(族/周期/类别等)以及元素间可解释的关联与约束关系。数据以可计算的知识图谱形式组织,支持元素表示学习、组成/性质预测、材料设计与分子生成等任务中的知识增强 (如检索增强、约束生成、语义提示与可控数据增强),从而为模型提供可审计、可扩展的科学先验与推理依据。
StarRailKG:《崩坏:星穹铁道》(个人)
《崩坏:星穹铁道》是米哈游开发的一款星际冒险主题回合制角色扮演游戏,自 2023 年上线以来积累了大量游戏角色、装备及其相关数据。本项目旨在构建一个基于知识图谱技术的游戏信息检索与问答系统,通过对游戏相关实体及其关系的系统化建模,实现对角色、光锥(武器装备)、材料、命途(角色路径分类)、阵营等游戏要素的智能化查询与分析。
鸡尾酒配方(个人)
数据集包括396款鸡尾酒的配方,制作方法,使用杯型,制作步骤等信息。 数据源:喝点鸡尾酒”网站(enjoycocktail.com)。
推理时知识融合框架:KGA(Knowledge Graph-guided Attention)(东南大学)
KGA: Inference-Time Knowledge Graph Fusion by Rewiring Attention for Adaptive Information Aggregation
可视化在线句法标注 – 信息依存语言模型(IDLM)(个人)
可视化在线句法标注 – 信息依存语言模型(IDLM)
HuggingKG:基于 Hugging Face 社区构建的用于机器学习资源管理的大规模知识图谱(南京大学)
HuggingKG 是第一个基于 Hugging Face 社区构建的用于机器学习资源管理的大规模知识图谱。HuggingKG 拥有 260 万个节点和 620 万条边,能够捕捉特定领域的丰富的系和文本属性。
中医经典方剂功效预测结果数据集(中国中医科学院中医药信息研究所科学数据研究室)
本数据集是依托课题中国中医科学院创新工程重大攻关项目-《面向大数据的方药分解功效预测模型研究》(CI2021A00508)进行的方剂功效预测研究。本研究利用超几何分布计算公式形成了超几何方剂功效预测模型,以174首经典方剂为样本,利用该模型进行了功效预测,模型预测功效的效果评测方法是F1(score)。评测过程是把模型预测结果和174首经典方剂原始记录功效进行比较,F1(score)为0.63。
