Karpathy LLM Wiki 模式

根据 Andrej Karpathy 提出的 LLM Wiki 模式,这是关于如何构建和维护个人知识库的核心概念页面。

定义

LLM Wiki 是一种使用大型语言模型(LLM)作为知识维护者,自动构建和维护持久化、结构化知识库的模式。它不同于传统的 RAG(检索增强生成),不是每次查询时重新发现知识,而是通过维基形式实现知识的复合增长。

核心理念

与传统 RAG 的区别

传统 RAG:

  • 上传文件集合
  • 每次查询时检索相关片段
  • 重新生成答案
  • 没有知识积累
  • 每次都需要重新拼凑信息

LLM Wiki:

  • 增量构建和维护持久化维基
  • 知识编译一次,保持更新
  • 交叉引用已经存在
  • 矛盾已经标记
  • 合成内容反映所有阅读内容

关键特性

  1. 持久化和复合增长: 维基是持久的、复合的工件,随着每次源文件添加和每次查询变得更丰富
  2. LLM 作为维护者: 用户负责策展和探索,LLM 负责所有维护工作
  3. 三层架构: 输入层、维基层、输出层
  4. 零维护成本: LLM 不会感到厌倦,不会忘记更新交叉引用

三层架构

1. 输入层 (Input / Raw Sources)

  • 位置: input/raw/
  • 内容: 原始源文件(文章、论文、文档、图像等)
  • 特性: 不可变,只读,真实数据源

2. 维基层 (Wiki Layer)

  • 位置: wiki/
  • 内容: LLM 生成和维护的 Markdown 页面
  • 类型:
    • 实体页面 (entities/)
    • 概念页面 (concepts/)
    • 源文件摘要 (summaries/)
    • 比较分析 (comparisons/)
    • 综合页面 (synthesis/)
  • 特性: 完全由 LLM 维护,保持一致性

3. 输出层 (Output Layer)

  • 位置: output/
  • 内容: 从维基生成的衍生内容
  • 格式: 幻灯片、报告、图表、可视化等

核心文件

index.md

  • 内容索引
  • 所有页面的目录
  • 按类别组织
  • 帮助快速定位

log.md

  • 按时间顺序的操作日志
  • 摄入、查询、维护记录
  • 追踪维基演进历史

SCHEMA.md

  • 维基结构规范
  • 页面格式模板
  • 工作流程定义
  • 命名和链接约定

工作流程

摄入流程 (Ingest)

  1. 用户将源文件放入 input/raw/
  2. LLM 阅读源文件
  3. 讨论关键要点
  4. 创建摘要页面
  5. 更新相关实体/概念页面(可能涉及 10-15 个页面)
  6. 更新索引
  7. 记录日志

查询流程 (Query)

  1. 用户提问
  2. 查找索引定位相关页面
  3. 读取维基页面
  4. 综合答案
  5. 答案可存回维基作为新页面

维护流程 (Lint)

  1. 定期健康检查
  2. 查找矛盾、过时内容、孤立页面
  3. 更新和优化
  4. 记录维护操作

应用场景

个人知识管理

  • 追踪目标、健康、心理学、自我提升
  • 归档日记条目、文章、播客笔记
  • 构建个人知识图谱

研究

  • 深入某个主题数周或数月
  • 阅读论文、文章、报告
  • 逐步构建综合维基,形成演进的论点

阅读书籍

  • 边读边归档每个章节
  • 构建人物、主题、情节线索的页面
  • 最终形成丰富的陪伴维基
  • 类似维基百科,但个人化

团队协作

  • 内部维基由 LLM 维护
  • 源自 Slack 线程、会议记录、项目文档、客户电话
  • 人类审核更新
  • 维基保持最新状态

其他应用

  • 竞争分析
  • 尽职调查
  • 旅行规划
  • 课程笔记
  • 爱好深入探索

为什么有效

人类的痛点

  • 维护知识库的繁琐部分不是阅读或思考
  • 而是簿记:更新交叉引用、保持摘要最新、标记矛盾、维护跨页面一致性
  • 人类放弃维基是因为维护负担增长快于价值

LLM 的优势

  • 不会感到厌倦
  • 不会忘记更新交叉引用
  • 一次可以触及 15 个文件
  • 维基保持维护是因为维护成本接近零

人类的角色

  • 策展源文件
  • 指导分析
  • 提出好问题
  • 思考意义

LLM 的角色

  • 一切其他工作

与 Memex 的关系

这个想法在精神上与 Vannevar Bush 的 Memex (1945) 相关:

  • 个人的、精心策划的知识存储
  • 文档之间的关联轨迹
  • 私有的、主动策划的
  • 连接与文档本身一样有价值

Bush 无法解决的部分是:谁来做维护?LLM 现在处理这个问题。

工具和实现

推荐工具

  • Obsidian: 作为维基的 IDE
  • Obsidian Web Clipper: 快速获取源文件
  • Dataview 插件: 查询页面前言
  • Marp 插件: 生成幻灯片
  • qmd: 本地搜索工具

实现要点

  • 维基只是 Git 仓库
  • 获得版本历史、分支、协作为免费赠品
  • 可以根据领域和偏好定制
  • 一切都是可选和模块化的

相关概念

参考资源

元数据

---
tags: [concept, llm-wiki, knowledge-management]
created: 2026-04-10
author: Andrej Karpathy (概念), lingyun (整理)
source-url: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
---

Evolution Log

  • 2026-04-24: 来自 维基工作区摘要 的认知:xcxnotes维基参考的核心知识库构建模式,原始灵感来自Andrej Karpathy的公开Gist,依托LLM实现结构化维基页面的自动生成与持续维护。