《狂飙》知识图谱(个人)

本项目是基于《狂飙》电视剧构建的人物关系知识图谱。

阿尔兹海默症知识图谱(个人)

本项目为阿尔兹海默症领域的知识图谱构建与查询系统,旨在从医学文献中提取相关实体和关系,构建结构化的知识网络,并提供便捷的查询功能。项目首先从PubTator格式的医学文献中提取实体和关系,生成三元组数据。随后,将这些数据上传到Neo4j图数据库中进行存储和管理。 在应用层面,项目提供了查询工具,支持用户通过节点名称查询相关的实体和关系,并实现了基于知识图谱的大模型RAG,为大模型的问答提供了详细可靠的理论支撑,有效避免了幻觉现象的发生。

MOF材料知识图谱(个人)

知识图谱中包含多孔材料结构参数数据、稳定性信息吸附性能和价格等多维度的标签数据信息。该数据库将为多孔材料建模的研究提供丰富的化学信息来源,推动人工智能材料研究领域的发展。

著名github仓库知识图谱(个人)

浙江大学知识图谱课程作业 详情请关注 https://github.com/FoggyDawn/GitHubRepository-KG 本数据集拓展了cnSchema,在此基础上收集了著名的github仓库,并利用规则和大模型抽取了关系

基于大数据教材知识图谱的推荐系统实现(个人)

首先以大数据技术教材《大数据技术原理与应用(第三版)》为核心数据源,通过数据清洗等预处理步骤,构建高质量语料库。然后基于 GraphRAG 技术进行知识图谱的构建,利用大语言模型进行实体抽取、关系建模及社区检测,定义了包含数据结构、算法等 32 类实体类型,通过提示词微调优化领域知识提取精度,最终将生成的知识图谱存储于 Neo4j 图数据库,实现大数据技术知识的结构化建模与可视化展示。基于构建好的知识图谱进行大数据相关知识的推荐系统实现。

菲尔兹奖知识图谱(个人)

菲尔兹奖知识图谱

CS-ArXiv-Citation-KG:计算机科学领域学术论文引用与知识图谱(个人)

本项目围绕电视剧《甄嬛传》人物,以中文 Wikipedia 为数据源,依次完成知识图谱数据预处理、文本知识抽取及问答功能实现,预处理阶段通过定向抓取角色信息、三重过滤去重、多格式转换,生成 108 条有效实体及 775 条 SPO 三元组并构建向量索引;知识抽取基于大模型采用 “上下文增强 — 联合抽取 — 后处理对齐” 架构,约束实体生成、完成非人生物归一化并扩展高阶语义关系;问答功能依托 RAG 思路,融合向量索引、语义检索与 Qwen2.5-7B-Instruct 大模型,实现低幻觉、可追溯的自然语言问答,整体模块化设计兼具可复用性与可扩展性。

甄嬛传(个人)

本项目围绕电视剧《甄嬛传》人物,以中文 Wikipedia 为数据源,依次完成知识图谱数据预处理、文本知识抽取及问答功能实现,预处理阶段通过定向抓取角色信息、三重过滤去重、多格式转换,生成 108 条有效实体及 775 条 SPO 三元组并构建向量索引;知识抽取基于大模型采用 “上下文增强 — 联合抽取 — 后处理对齐” 架构,约束实体生成、完成非人生物归一化并扩展高阶语义关系;问答功能依托 RAG 思路,融合向量索引、语义检索与 Qwen2.5-7B-Instruct 大模型,实现低幻觉、可追溯的自然语言问答,整体模块化设计兼具可复用性与可扩展性。

孙燕姿音乐知识图谱及问答系统(个人)

本项目旨在构建一个垂直领域的孙燕姿音乐知识图谱,整理孙燕姿歌曲的作词人、作曲人、所属专辑等信息,并基于此开发智能问答系统。首先,从互联网中爬取孙燕姿歌曲的目录与非结构化文本等信息。随后,引入 LLM 进行实体抽取,从网页长文本中精准抽取出作词、作曲、所属专辑等结构化元数据,并对缺失信息进行补全。处理后的数据被清洗并转化为标准的三元组格式,最终导入Neo4j图数据库中,实现孙燕姿音乐知识网络的可视化与持久化存储。在应用层面,项目基于孙燕姿音乐的图谱结构构建了检索增强生成(RAG)问答系统。该系统能够解析用户的自然语言提问,从图数据库中检索相关的子图知识作为上下文,从而引导LLM生成回答,实现静态图谱数据向动态智能交互的转化。

基于知识图谱和 LLM 的 AI 顶会论文智能检索与分析平台(个人)

支持 ICLR、ICML、NeurIPS 2025 论文的搜索、问答和可视化

1 2345>>
zh_CNZH_CN