个人知识库
Obsidian 精细化使用指南:从笔记软件到可审计的个人 AI 记忆系统
系统介绍 Obsidian 的主要能力、实际使用流程、底层技术和 AI 工作流接法:Markdown vault、双向链接、Properties、Search、Canvas、Bases、CodeMirror、插件 API 与同步加密。
来源说明
这篇文章重写为一份更细的 Obsidian 使用与技术研究笔记。它面向的读者不是只想换一个笔记 App 的人,而是想把个人知识、论文阅读、项目决策和 AI 辅助工作流沉淀成长期记忆系统的人。
稳定 slug:2026-04-28-obsidian-personal-memory-system。
参考来源:
- Obsidian Help: How Obsidian stores data
- Obsidian Help: Core plugins
- Obsidian Help: Internal links
- Obsidian Help: Backlinks
- Obsidian Help: Outgoing links
- Obsidian Help: Properties
- Obsidian Help: Properties view
- Obsidian Help: Search
- Obsidian Help: Graph view
- Obsidian Help: Create a base
- Obsidian: Canvas
- Obsidian Developer Docs: Vault
- Obsidian Developer Docs: Editor
- Obsidian Help: Security and privacy
先给结论
Obsidian 最值得研究的地方,不是它能写 Markdown,而是它把“本地文件、显式链接、结构化属性、搜索、图谱视图、插件 API”放进了同一个工作台。
如果只把它当作日记软件,很容易写成一堆沉底文本。如果按记忆系统设计,它可以承担四个角色:
- 捕获层:把网页、论文、灵感、会议记录、项目问题先落到本地文件。
- 整理层:用链接、标题、目录、properties 和标签把信息整理成可检索对象。
- 回忆层:通过搜索、反向链接、图谱、Canvas 和 Bases 找回上下文。
- AI 上游知识源:把经过人类审查的 Markdown 笔记定期索引给 AI 使用。
它不是数据库,也不是向量库,更不是自动推理系统。它的定位应当是“人类可读、可迁移、可审计的长期记忆源”。
Obsidian 是什么
Obsidian 是一个围绕本地 vault 工作的知识库软件。vault 可以理解为一个普通文件夹,里面主要是 Markdown 文件,也可以放图片、PDF、Canvas、配置和插件数据。Obsidian 官方帮助说明,它把笔记存储为 Markdown 格式的纯文本文件,因此其他文本编辑器和文件管理器也可以直接编辑和管理这些笔记。
这和 Notion、语雀、飞书文档、Google Docs 的核心差异很大:
- Obsidian 以本地文件为中心,而不是云端数据库为中心。
- 笔记默认属于你自己的文件系统,而不是某个 SaaS 的数据表。
- 内容可以被 Git、脚本、静态站生成器、全文搜索和 AI 索引器复用。
- 应用本身提供编辑、链接、视图和插件能力,但不把你的知识锁死在专有存储里。
这就是它适合做个人长期记忆的原因。长期记忆最怕黑箱:你不知道数据在哪里,不知道怎么迁移,不知道模型引用的是哪条材料。Obsidian 的底座是普通文本文件,至少保留了最低限度的可控性。
主要能力一览
1. Markdown 笔记
Obsidian 的基础内容是 Markdown。你可以写标题、列表、引用、代码块、表格、任务列表、图片引用和链接。它的优势不是语法复杂,而是格式足够简单,适合长期保存。
典型笔记可以这样写:
# LoCoMo 长期记忆评测
## 核心问题
LoCoMo 试图评估长对话场景中的记忆召回能力。
## 我的判断
它适合评估跨 session 信息回忆,但不能直接代表企业知识库检索效果。
## 相关链接
- [[Long-term memory]]
- [[Memory evaluation]]
- [[RAG]]
这类文本可以被 Obsidian 渲染,也可以被普通编辑器打开。对 AI 工作流来说,它也是很好的输入格式:结构清楚、噪声少、容易切块。
2. 内部链接
Obsidian 支持两种内部链接格式:
[[Long-term memory]]
[Long-term memory](Long-term%20memory.md)
默认的 [[Wikilink]] 很适合快速写作;如果你更重视跨工具兼容,可以在设置里关闭 Wikilinks,让 Obsidian 生成标准 Markdown 链接。
链接的作用不是让图谱变好看,而是让知识形成可解释关系。例如:
[[Obsidian]] 可以作为 [[AI memory]] 的人类审查层,但不能替代 [[Vector database]]。
这句话同时表达了三个节点和两条关系。未来你查看 AI memory 的反向链接时,会看到这条判断。AI 重新索引 vault 时,也能用链接关系辅助主题聚类。
3. 反向链接和未链接提及
Backlinks 会显示哪些笔记链接到了当前笔记。Outgoing links 会显示当前笔记链接出去的对象,以及未链接提及。官方文档里提到,未链接提及可以发现那些文本中出现了某个笔记名称、但还没有真正建立链接的位置。
这个能力很实用。比如你有一篇 RAG 概念笔记,后来在很多项目笔记里写过 RAG 但没有链接。未链接提及可以提醒你:这些材料也许应该纳入 RAG 的知识网络。
我的使用建议:
- 概念笔记看 Backlinks,用来发现自己在哪些地方用过这个概念。
- 项目笔记看 Outgoing links,用来检查是否遗漏了关键概念链接。
- 每周处理一次未链接提及,不要每天被它打断。
4. Properties
Properties 是 Obsidian 里非常重要但常被低估的能力。官方文档说明,properties 用来组织笔记里的结构化数据,支持文本、链接、日期、复选框、数字等类型;它们以 YAML 格式存储在文件顶部。
一篇论文笔记可以这样写:
---
type: literature
source: https://example.com/paper
status: reading
confidence: medium
reviewed_at: 2026-04-28
tags:
- ai-memory
- retrieval
---
这些字段让笔记从“文章”变成“可筛选对象”。你以后可以搜索:
[type:literature] [status:reading]
或者建立 Bases 视图,把所有 type=literature 的笔记按 status、confidence、reviewed_at 排序。
我的推荐字段:
---
type: literature | concept | project | decision | experiment | source
status: inbox | reading | active | reviewed | archived
source:
confidence: low | medium | high
reviewed_at:
related:
tags:
---
注意不要把 properties 设计得太复杂。它适合小而稳定的元数据,不适合塞长段 Markdown。
5. Search
Obsidian 的 Search 是核心插件,不只是简单关键字搜索。官方文档列出了一批搜索操作符,例如:
file:
path:
content:
tag:
line:
match-case:
ignore-case:
你可以这样查:
tag:#ai-memory path:"10-literature"
意思是在 10-literature 路径里找带 #ai-memory 的材料。
再比如:
content:"context compression" -path:"90-archive"
意思是找包含 context compression 的笔记,但排除归档区。
Search 还能用正则。例如:
path:/2026-\d{2}-\d{2}/
这适合查日期命名的文件。对大型 vault 来说,搜索能力比图谱更常用,因为你需要的是稳定找回,而不是视觉展示。
6. Graph view
Graph view 把笔记显示成节点,把内部链接显示成边。它适合回答这些问题:
- 哪些概念已经形成密集关联?
- 哪些笔记是孤立节点?
- 某个主题附近有哪些相邻材料?
- 一个项目牵涉了哪些论文、概念和决策?
但图谱不是知识质量指标。节点多、线多,只能说明链接多,不能说明理解深。对研究型 vault,我更建议使用 Local Graph,而不是整站大图。打开某篇核心概念笔记,查看它一跳或两跳范围内的材料,往往比看全局图更有用。
7. Canvas
Canvas 是 Obsidian 的无限画布,用来把笔记、卡片、图片和关系放到一个空间里。它适合处理“线性文章不好表达”的问题:
- 一篇论文的方法结构。
- 一个 AI 记忆系统的模块关系。
- 多个开源项目的架构对比。
- 一篇长文的提纲和证据链。
我建议把 Canvas 当作研究白板,而不是最终知识库。比如研究 Obsidian 时,可以建一个 Obsidian as memory system.canvas:
左侧:主要能力
中间:底层技术
右侧:AI 记忆系统接法
下方:风险和失败模式
等结构稳定后,再把结论沉淀成 Markdown 笔记。Canvas 用来组织思考,Markdown 用来保存结论。
8. Bases
Bases 是 Obsidian 新一些的核心能力,官方帮助称它可以创建 database-like views of your notes。它可以基于 properties 建立表格或其他视图,也可以嵌入到笔记中。
一个研究库可以建这些 Bases:
Reading Queue:筛选type=literature且status=reading。Reviewed Papers:筛选type=literature且status=reviewed。Open Questions:筛选type=question。Decisions:筛选type=decision,按reviewed_at排序。
这让 Obsidian 具备轻量数据库的使用体验,但底层仍然是 Markdown 文件和 properties。它适合个人研究管理,不适合替代真正的业务数据库。
9. 核心插件和社区插件
Obsidian 内置了很多核心插件,例如 Backlinks、Canvas、Command palette、Daily notes、File recovery、Graph view、Outline、Page preview、Properties view、Search、Templates、Workspaces 等。核心插件已经足够支撑严肃使用。
我不建议一开始装很多社区插件。更稳的顺序是:
- 先用核心插件建立目录、链接、properties、搜索和模板。
- 确认自己的流程稳定后,再装少量插件补短板。
- 每个插件都要问:关掉它后,我的核心内容还读得懂吗?
如果答案是否定的,说明它已经从“工具”变成“锁定风险”。
一套可照着做的使用流程
下面是一套适合技术研究、AI 记忆系统和博客写作的 Obsidian 流程。
第一步:创建 vault 目录
建议先从 7 个目录开始:
00-inbox/
10-sources/
20-literature/
30-concepts/
40-projects/
50-decisions/
90-archive/
含义如下:
00-inbox:临时捕获,不要求干净。10-sources:原始网页、论文链接、仓库链接、引用材料。20-literature:论文和长文阅读笔记。30-concepts:长期概念,比如 RAG、episodic memory、context compression。40-projects:项目实践、实验记录、部署记录。50-decisions:明确决策,记录为什么这样做。90-archive:过时材料,保留但降低优先级。
不要一开始建立几十个目录。目录越多,捕获越慢,维护成本越高。
第二步:准备 4 个模板
论文模板
---
type: literature
status: reading
source:
confidence: medium
reviewed_at:
tags:
- ai-memory
---
# {{title}}
## 研究问题
## 方法
## 实验设置
## 关键结论
## 局限
## 对工程的启发
## 相关链接
- [[AI memory]]
- [[Memory evaluation]]
概念模板
---
type: concept
status: active
confidence: medium
reviewed_at:
tags:
---
# {{concept}}
## 定义
## 它解决什么问题
## 常见实现
## 容易误解的地方
## 相关材料
项目模板
---
type: project
status: active
source:
confidence: medium
reviewed_at:
tags:
---
# {{project}}
## 目标
## 当前架构
## 关键接口
## 运行方式
## 风险
## 下一步
决策模板
---
type: decision
status: reviewed
confidence: high
reviewed_at: 2026-04-28
tags:
---
# 决策:{{title}}
## 背景
## 选择
## 为什么不选其他方案
## 未来何时重新评估
这 4 类模板足够覆盖大多数研究工作。重点是让笔记能被自己复查,也能被 AI 索引器识别。
第三步:捕获材料,不急着整理
看到一篇论文、一条技术博客或一个 GitHub 仓库,先放进 00-inbox 或 10-sources。不要在捕获阶段追求完美。
一个原始材料笔记可以很短:
---
type: source
status: inbox
source: https://github.com/example/project
tags:
- ai-memory
---
# example/project
## 为什么值得看
可能和长期记忆检索有关。
## 待验证
- 是否有持久化层
- 是否支持删除或更新记忆
- 是否有评测脚本
这样做的好处是材料不会丢,但也不会污染正式概念库。
第四步:阅读时拆成三种笔记
不要把所有东西塞进一篇长笔记。读完一篇材料后,至少拆成三类:
- source note:原始来源和摘录。
- concept note:可复用概念。
- decision note:你自己的判断。
例如读一篇关于长期记忆的论文,可以产生:
20-literature/LoCoMo benchmark.md
30-concepts/Long-term memory evaluation.md
50-decisions/为什么博客文章需要标注来源和局限.md
这比一篇 5000 字杂糅笔记更适合长期复用。AI 后续检索时,也更容易拿到干净上下文。
第五步:用链接表达关系
每篇正式笔记至少要有 3 类链接:
- 上位概念:这篇笔记属于哪个大主题。
- 相邻材料:和哪篇论文、仓库、文章有关。
- 输出结果:这条材料最后支持了哪个决策或文章。
示例:
## 相关链接
- 上位概念:[[AI memory]]
- 相邻材料:[[RAG]], [[Context compression]], [[Memory evaluation]]
- 输出结果:[[决策:把 Obsidian 作为 AI 记忆源]]
链接不是装饰,它是你的人工知识图谱。
第六步:用搜索和 Bases 做复盘
每周可以查这些搜索:
[status:inbox]
找还没处理的材料。
[type:literature] [status:reading]
找读到一半的论文。
tag:#ai-memory -path:"90-archive"
找当前有效的 AI memory 材料。
content:"TODO" -path:"90-archive"
找未完成任务。
如果你已经开始用 Bases,就把这些查询做成视图。这样每次打开 Obsidian 都能看到“哪些材料需要处理”,而不是凭记忆翻文件。
第七步:用 Canvas 组织复杂文章
写复杂文章前,我建议先建 Canvas:
中心:文章主问题
左侧:官方文档和事实来源
右侧:自己的判断
上方:技术机制
下方:失败模式和指标
对于本文,Canvas 可以这样组织:
Obsidian 是什么
-> Markdown vault
-> Links / Backlinks
-> Properties
-> Search / Bases
-> Plugin API
-> AI memory pipeline
当 Canvas 结构稳定,再写成文章。这样文章会比直接从头写更有骨架。
Obsidian 用到的技术
本地文件系统和 Markdown
Obsidian 的核心技术选择是本地文件加 Markdown。它不把知识存成不可读的云端对象,而是把文件系统作为长期存储层。对个人记忆系统来说,这解决了三个问题:
- 数据可迁移。
- 数据可版本化。
- 数据可被外部程序读取。
这也是为什么它适合和 Git、静态博客、全文搜索、向量索引、脚本自动化配合。
链接解析和元数据索引
Obsidian 能显示反向链接、图谱、未链接提及、properties view,本质上需要持续解析 vault 里的 Markdown、链接、frontmatter、标签和文件路径。
它并不是只打开当前文件,而是在应用层维护了一套 metadata cache。插件也可以基于这些解析结果工作。对 AI 系统来说,这一层很有价值:它已经把纯文本材料提升成“有路径、有链接、有标签、有属性”的半结构化知识库。
CodeMirror 编辑器
Obsidian 开发者文档说明,它使用 CodeMirror 作为底层文本编辑器,并通过自己的 Editor API 暴露编辑能力。CodeMirror 的存在让 Obsidian 能实现:
- Live Preview。
- 编辑器命令。
- 选区操作。
- 插件增强。
- 编辑器视图扩展。
这也是为什么它既像 Markdown 编辑器,又能拥有接近 IDE 的扩展能力。
TypeScript 插件 API
Obsidian 插件使用 TypeScript 开发。开发者可以通过 Vault API 访问文件,通过 Editor API 操作编辑器,通过 Workspace 管理界面和视图。
官方 Vault 文档示例展示了读取所有 Markdown 文件、缓存读取、修改文件等操作。这说明 Obsidian 插件可以直接围绕本地知识库做自动化,例如:
- 批量扫描笔记。
- 生成索引页。
- 重写 properties。
- 调用本地或远端模型摘要笔记。
- 把笔记导出到向量库。
这也是它能成为 AI 工作流入口的原因之一。
Canvas 和 Bases
Canvas 是空间化组织层,适合表达非线性关系。Bases 是基于 properties 的数据库式视图,适合管理状态和列表。
它们的共同点是:不改变底层知识源,而是在同一批文件上创建不同视图。这个设计很重要。好的记忆系统不应该把数据复制成十份,而应该在同一份源数据上创建不同索引和视图。
Sync 和加密
Obsidian Sync 的安全说明提到,远端 vault 和通信会加密;新建远端 vault 时,端到端加密是默认选项。文档还说明其技术细节包括 scrypt 派生密钥,以及 AES-256-GCM 加密。
但要注意:这不代表本地 vault 自动加密。本地安全仍然取决于你的系统账号、磁盘加密和备份策略。
和 AI 记忆系统怎么接
我建议的接法不是“让 AI 随便写 Obsidian”,而是把 Obsidian 作为审查后的源材料层:
捕获材料
-> Obsidian 整理
-> 人类审查 status/confidence/source
-> 脚本抽取 Markdown
-> 全文索引 + 向量索引
-> AI 检索使用
-> 错误回写 Obsidian
这个流程里,Obsidian 保存的是可审查原文。AI 真正使用时,可以从 Obsidian 导出或读取:
- 文件路径。
- 标题。
- properties。
- 正文块。
- 内部链接。
- 来源 URL。
- 最近更新时间。
然后建立索引。索引层可以是 SQLite FTS、Postgres、Meilisearch、Typesense、向量数据库,或者简单的本地脚本。
关键约束是:AI 回答必须能回链到 Obsidian 原文。否则你只是把一个可审计系统变成了新的黑箱。
Obsidian 适合什么,不适合什么
适合:
- 论文阅读和开源项目研究。
- 个人项目知识库。
- 长期博客素材库。
- AI 助手的人工审查记忆源。
- 需要本地优先、可迁移、可版本化的个人知识系统。
不适合:
- 多人实时协作写作。
- 强权限、强审计的企业知识管理。
- 高频事务型业务数据库。
- 大规模线上检索服务。
- 完全自动化、无人审查的 AI 记忆写入。
这不是 Obsidian 的缺点,而是边界。它适合个人和小团队的知识工作台,不适合替代业务系统。
常见错误
错误一:把 inbox 当知识库
只收藏不整理,最后 vault 会变成浏览器书签的另一个副本。解决方法是给每条材料一个状态:
status: inbox | reading | reviewed | archived
每周只处理 status: inbox 的内容。
错误二:标签太多
标签应该帮助检索,而不是表达情绪。#好文、#以后看、#重要 通常会失控。更好的标签是稳定主题:
#ai-memory
#rag
#obsidian
#evaluation
#postgres
错误三:链接没有语义
不要为了链接而链接。每个链接最好能回答:为什么它们有关?
差的写法:
相关:[[AI]] [[工具]] [[笔记]]
好的写法:
Obsidian 适合作为 [[AI memory]] 的人类审查层,因为它的 Markdown vault 可以被重新索引。
错误四:插件过载
插件可以增强效率,但插件越多,迁移风险越大。判断标准很简单:关掉插件后,核心内容还是否可读?如果不可读,就要谨慎。
错误五:AI 自动写入未审查内容
如果让 AI 自动把对话摘要、用户偏好和结论写进 Obsidian,却没有 source、confidence、reviewed_at,下一次检索时就可能把旧幻觉当成事实。
可验证指标
判断一个 Obsidian vault 是否真正成为记忆系统,可以看这些指标:
- 关键结论是否有来源。
- 重要笔记是否有 properties。
- 一分钟内能否找回某个项目决策。
- 概念笔记是否能通过 backlinks 找到实际使用场景。
- inbox 是否长期堆积。
- 归档区是否排除在日常检索之外。
- AI 使用的上下文是否能回链到原文。
- 关掉社区插件后,核心知识是否仍可读。
如果这些指标成立,Obsidian 就不只是“笔记软件”,而是一个小型、透明、可迁移的个人记忆系统。
工程结论
Obsidian 的核心能力可以总结为:
- 用 Markdown 文件承载长期内容。
- 用链接和反向链接表达显式关系。
- 用 properties 给笔记加轻量 schema。
- 用 Search、Graph、Canvas、Bases 建立不同检索和组织视图。
- 用 TypeScript 插件 API 连接自动化和 AI 工作流。
- 用同步和加密方案解决多端访问,但本地安全仍需自己负责。
如果你要研究 AI 记忆系统,Obsidian 值得重点看,不是因为它本身很“智能”,而是因为它提供了一个朴素但可靠的事实:长期记忆首先要能被人读懂、修改、迁移和验证。AI 可以参与召回和总结,但记忆源最好仍然保持可审计。
自审
- 事实可靠性:核心事实来自 Obsidian 官方帮助、开发者文档和同步安全说明。
- 来源完整性:覆盖数据存储、核心插件、内部链接、反向链接、properties、搜索、图谱、Bases、Canvas、Vault API、Editor API 和同步加密。
- 原创性:文章重点是具体使用流程、技术能力拆解和 AI 记忆系统接法,不复述官方教程。
- 标题风险:标题描述 Obsidian 的使用和技术定位,不宣称它能自动解决个人知识管理。
- 薄内容检查:包含主要能力、使用步骤、模板、搜索语法、技术层、适用边界、错误模式和评估指标。
- 猜测边界:未把图谱、插件或同步能力夸大成自动推理、数据库或企业权限系统。
- 站内重复:与基础设施化 AI memory 文章不同,本文聚焦个人知识库和可审计记忆源。