174首中医经典方剂结构化数据集(中国中医科学院中医药信息研究所科学数据研究室)
本数据集依托课题中国中医科学院创新工程重大攻关项目-《面向大数据的方药分解功效预测模型研究》(CI2021A00508),共包括174首中医经典方剂。研究所选方剂来自《方剂学》,仅纳入方解中方药组成的君臣佐使及中药计量具有明确说明的方剂。参考的方剂学教材书籍包括《方剂学(新世纪第4版)》、《方剂学(第3版)》、《方剂学(供中医药类专业用)》。 数据集中涉及的方剂数据均已进行标准化处理,药名标准化、药物剂量标准化、中药剂量标准化参考《中华人民共和国药典》(2020版)。
中医妇科专科症状术语正异名数据集(中国中医科学院中医药信息研究所科学数据研究室)
本数据集聚焦于中医妇科特有症状术语的规范与对照,构建了“正名—异名”术语映射资源,涵盖崩漏、闭经、不孕、痛经四种高频妇科病种。术语来源包括1984年至今中医药期刊数据库中的相关文献,以及1951—2003年间公开发表的现代中医医案。医案所选医家均为20世纪二、三十年代出生、经验丰富的中医专家。 在术语标准化过程中,本研究对同义术语进行了系统统计,依据词项出现频次,结合人工经验判断,确定了出现频率最高的表达形式作为术语“正名”。本数据集去除通用舌脉等内容,专注于妇科领域的专有症状表述,适用于中医信息建模、术语标准化与语义挖掘等研究任务。
诺贝尔文学奖提名知识图谱(个人)
诺贝尔文学奖提名知识图谱
2023年QS世界大学排名前50名介绍(个人)
2023年QS世界大学排名前50名介绍
20味常用中药知识图谱(中国中医科学院中医药信息研究所科学数据研究室)
中研院信息所数据室在所承担的方剂预测课题研究中(方剂预测小程序见本文文末),成功构建了一套中药知识图谱,为本研究提供了重要的技术支持。目前,该知识图谱部分已免费开放共享,诚邀中医药学者、科研团队及相关企业申请使用,希望共同推动中医药信息领域的学术研究与实际应用。 知识图谱涵盖的实体包括中药、功效、症状、证候、疾病等,部分节点关系示例点击网址链接即可进去。
开放知识图谱项目:林俊杰歌曲知识图谱(个人)
本项目旨在构建一个基于开放域数据的知识图谱,并贡献至 OpenKG.cn。 本项目尝试对林俊杰出道以来参与过的所有歌曲作品、专辑以及合作歌手、作词人进行关系分析,将这些信息组织成三元组构建知识图谱,并基于知识图谱实现一个有关林俊杰歌曲的在线检索系统。
邓紫棋音乐作品知识图谱(个人)
There is no description for this dataset.
OneGraph:利用大模型构建LLM需要的知识图谱(浙江大学等)
OneGraph是一个利用大模型构建的LLM需要的开放知识图谱,尽量满足了高准确性、高覆盖率、和低成本的特性。同时,OneGraph提供了一套完整的大语言模型知识增强的通用服务框架。 该版本为OneGraphV1版,发布于2024年10月23日,包含三元组25407912个,实体12051753个,关系15410个,经评估该版本的数据准确率为0.80,其中有32.28%的三元组为大模型生成。
unKR:不确定性知识图谱推理工具(东南大学等)
unKR是东南大学研发的不确定知识图谱推理工具。其实质是一个开源Python库,设计了一个统一的框架来实现两种类型的UKG推理表示学习模型,即普通模型和小样本模型。 unKR提供了一套统一的工作流程与五个独立模块,旨在促进模型复现、定制与性能评估的标准化。通过在三大基准数据集上实施统一的评估框架,希望推动UKG推理模型可靠比较,并为UKG推理研究与应用提供坚实的基础。
AsdKB:孤独症谱系障碍知识库(东南大学等)
为了方便地获得有关孤独症谱系障碍的知识并辅助进行早期筛查和诊断,我们构建了中文首个孤独症谱系障碍知识库AsdKB。该知识库的知识主要包括 1)疾病知识:来源于SNOMED CT和《ICD-10精神与行为障碍临床描述》中的疾病和症状描述,2)诊断知识:来源于DSM-5中的诊断标准以及社会组织和医疗机构推荐的筛查量表,3)专家知识:来源于医疗网站的孤独症相关医生和医院信息。
