输入层
定义
输入层是 Wiki 三层架构中的第一层,位于 input/ 目录,存储所有原始源文件(包括文章、论文、文档、图像等)。其核心特性为不可变(只读)且作为真实数据源,由用户手动添加或通过 Web Clipper 收集。输入层是维基知识的基础,所有后续处理都基于此层。
关键特征
- 不可变性:输入层文件为只读状态,一旦添加即不允许修改,确保原始数据的真实性和可追溯性
- 真实数据源:作为知识库的单一真实来源(Single Source of Truth),所有后续处理和分析都以此为基准
- 手动或自动收集:文件可通过用户手动添加,或通过 obsidian-web-clipper 等工具自动收集
- 目录结构:建议的子目录包括
input/raw/、input/assets/、input/sources/,用于分类存储不同类型的原始文件
应用
- 知识采集:作为知识管理流程的起点,收集所有需要处理的原始资料
- 数据溯源:在分析和处理过程中,始终可回溯到输入层的原始文件进行验证
- 版本控制:不可变特性使其适合与版本控制系统(如 Git)配合,确保历史记录完整
- 批量处理:输入层的结构化目录便于自动化脚本对原始文件进行批量处理和分析