Karpathy LLM Wiki 模式
根据 Andrej Karpathy 提出的 LLM Wiki 模式,这是关于如何构建和维护个人知识库的核心概念页面。
定义
LLM Wiki 是一种使用大型语言模型(LLM)作为知识维护者,自动构建和维护持久化、结构化知识库的模式。它不同于传统的 RAG(检索增强生成),不是每次查询时重新发现知识,而是通过维基形式实现知识的复合增长。
核心理念
与传统 RAG 的区别
传统 RAG:
- 上传文件集合
- 每次查询时检索相关片段
- 重新生成答案
- 没有知识积累
- 每次都需要重新拼凑信息
LLM Wiki:
- 增量构建和维护持久化维基
- 知识编译一次,保持更新
- 交叉引用已经存在
- 矛盾已经标记
- 合成内容反映所有阅读内容
关键特性
- 持久化和复合增长: 维基是持久的、复合的工件,随着每次源文件添加和每次查询变得更丰富
- LLM 作为维护者: 用户负责策展和探索,LLM 负责所有维护工作
- 三层架构: 输入层、维基层、输出层
- 零维护成本: LLM 不会感到厌倦,不会忘记更新交叉引用
三层架构
1. 输入层 (Input / Raw Sources)
- 位置:
input/raw/ - 内容: 原始源文件(文章、论文、文档、图像等)
- 特性: 不可变,只读,真实数据源
2. 维基层 (Wiki Layer)
- 位置:
wiki/ - 内容: LLM 生成和维护的 Markdown 页面
- 类型:
- 实体页面 (entities/)
- 概念页面 (concepts/)
- 源文件摘要 (summaries/)
- 比较分析 (comparisons/)
- 综合页面 (synthesis/)
- 特性: 完全由 LLM 维护,保持一致性
3. 输出层 (Output Layer)
- 位置:
output/ - 内容: 从维基生成的衍生内容
- 格式: 幻灯片、报告、图表、可视化等
核心文件
index.md
- 内容索引
- 所有页面的目录
- 按类别组织
- 帮助快速定位
log.md
- 按时间顺序的操作日志
- 摄入、查询、维护记录
- 追踪维基演进历史
SCHEMA.md
- 维基结构规范
- 页面格式模板
- 工作流程定义
- 命名和链接约定
工作流程
摄入流程 (Ingest)
- 用户将源文件放入
input/raw/ - LLM 阅读源文件
- 讨论关键要点
- 创建摘要页面
- 更新相关实体/概念页面(可能涉及 10-15 个页面)
- 更新索引
- 记录日志
查询流程 (Query)
- 用户提问
- 查找索引定位相关页面
- 读取维基页面
- 综合答案
- 答案可存回维基作为新页面
维护流程 (Lint)
- 定期健康检查
- 查找矛盾、过时内容、孤立页面
- 更新和优化
- 记录维护操作
应用场景
个人知识管理
- 追踪目标、健康、心理学、自我提升
- 归档日记条目、文章、播客笔记
- 构建个人知识图谱
研究
- 深入某个主题数周或数月
- 阅读论文、文章、报告
- 逐步构建综合维基,形成演进的论点
阅读书籍
- 边读边归档每个章节
- 构建人物、主题、情节线索的页面
- 最终形成丰富的陪伴维基
- 类似维基百科,但个人化
团队协作
- 内部维基由 LLM 维护
- 源自 Slack 线程、会议记录、项目文档、客户电话
- 人类审核更新
- 维基保持最新状态
其他应用
- 竞争分析
- 尽职调查
- 旅行规划
- 课程笔记
- 爱好深入探索
为什么有效
人类的痛点
- 维护知识库的繁琐部分不是阅读或思考
- 而是簿记:更新交叉引用、保持摘要最新、标记矛盾、维护跨页面一致性
- 人类放弃维基是因为维护负担增长快于价值
LLM 的优势
- 不会感到厌倦
- 不会忘记更新交叉引用
- 一次可以触及 15 个文件
- 维基保持维护是因为维护成本接近零
人类的角色
- 策展源文件
- 指导分析
- 提出好问题
- 思考意义
LLM 的角色
- 一切其他工作
与 Memex 的关系
这个想法在精神上与 Vannevar Bush 的 Memex (1945) 相关:
- 个人的、精心策划的知识存储
- 文档之间的关联轨迹
- 私有的、主动策划的
- 连接与文档本身一样有价值
Bush 无法解决的部分是:谁来做维护?LLM 现在处理这个问题。
工具和实现
推荐工具
- Obsidian: 作为维基的 IDE
- Obsidian Web Clipper: 快速获取源文件
- Dataview 插件: 查询页面前言
- Marp 插件: 生成幻灯片
- qmd: 本地搜索工具
实现要点
- 维基只是 Git 仓库
- 获得版本历史、分支、协作为免费赠品
- 可以根据领域和偏好定制
- 一切都是可选和模块化的
相关概念
参考资源
- 原文: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
- 相关实现:
- Obsidian 插件:
元数据
---
tags: [concept, llm-wiki, knowledge-management]
created: 2026-04-10
author: Andrej Karpathy (概念), lingyun (整理)
source-url: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
---Evolution Log
- 2026-04-24: 来自 维基工作区摘要 的认知:xcxnotes维基参考的核心知识库构建模式,原始灵感来自Andrej Karpathy的公开Gist,依托LLM实现结构化维基页面的自动生成与持续维护。