个人知识库

Obsidian 精细化使用指南:从笔记软件到可审计的个人 AI 记忆系统

系统介绍 Obsidian 的主要能力、实际使用流程、底层技术和 AI 工作流接法:Markdown vault、双向链接、Properties、Search、Canvas、Bases、CodeMirror、插件 API 与同步加密。

来源说明

这篇文章重写为一份更细的 Obsidian 使用与技术研究笔记。它面向的读者不是只想换一个笔记 App 的人,而是想把个人知识、论文阅读、项目决策和 AI 辅助工作流沉淀成长期记忆系统的人。

稳定 slug:2026-04-28-obsidian-personal-memory-system

参考来源:

先给结论

Obsidian 最值得研究的地方,不是它能写 Markdown,而是它把“本地文件、显式链接、结构化属性、搜索、图谱视图、插件 API”放进了同一个工作台。

如果只把它当作日记软件,很容易写成一堆沉底文本。如果按记忆系统设计,它可以承担四个角色:

  • 捕获层:把网页、论文、灵感、会议记录、项目问题先落到本地文件。
  • 整理层:用链接、标题、目录、properties 和标签把信息整理成可检索对象。
  • 回忆层:通过搜索、反向链接、图谱、Canvas 和 Bases 找回上下文。
  • AI 上游知识源:把经过人类审查的 Markdown 笔记定期索引给 AI 使用。

它不是数据库,也不是向量库,更不是自动推理系统。它的定位应当是“人类可读、可迁移、可审计的长期记忆源”。

Obsidian 是什么

Obsidian 是一个围绕本地 vault 工作的知识库软件。vault 可以理解为一个普通文件夹,里面主要是 Markdown 文件,也可以放图片、PDF、Canvas、配置和插件数据。Obsidian 官方帮助说明,它把笔记存储为 Markdown 格式的纯文本文件,因此其他文本编辑器和文件管理器也可以直接编辑和管理这些笔记。

这和 Notion、语雀、飞书文档、Google Docs 的核心差异很大:

  • Obsidian 以本地文件为中心,而不是云端数据库为中心。
  • 笔记默认属于你自己的文件系统,而不是某个 SaaS 的数据表。
  • 内容可以被 Git、脚本、静态站生成器、全文搜索和 AI 索引器复用。
  • 应用本身提供编辑、链接、视图和插件能力,但不把你的知识锁死在专有存储里。

这就是它适合做个人长期记忆的原因。长期记忆最怕黑箱:你不知道数据在哪里,不知道怎么迁移,不知道模型引用的是哪条材料。Obsidian 的底座是普通文本文件,至少保留了最低限度的可控性。

主要能力一览

1. Markdown 笔记

Obsidian 的基础内容是 Markdown。你可以写标题、列表、引用、代码块、表格、任务列表、图片引用和链接。它的优势不是语法复杂,而是格式足够简单,适合长期保存。

典型笔记可以这样写:

# LoCoMo 长期记忆评测

## 核心问题

LoCoMo 试图评估长对话场景中的记忆召回能力。

## 我的判断

它适合评估跨 session 信息回忆,但不能直接代表企业知识库检索效果。

## 相关链接

- [[Long-term memory]]
- [[Memory evaluation]]
- [[RAG]]

这类文本可以被 Obsidian 渲染,也可以被普通编辑器打开。对 AI 工作流来说,它也是很好的输入格式:结构清楚、噪声少、容易切块。

2. 内部链接

Obsidian 支持两种内部链接格式:

[[Long-term memory]]
[Long-term memory](Long-term%20memory.md)

默认的 [[Wikilink]] 很适合快速写作;如果你更重视跨工具兼容,可以在设置里关闭 Wikilinks,让 Obsidian 生成标准 Markdown 链接。

链接的作用不是让图谱变好看,而是让知识形成可解释关系。例如:

[[Obsidian]] 可以作为 [[AI memory]] 的人类审查层,但不能替代 [[Vector database]]。

这句话同时表达了三个节点和两条关系。未来你查看 AI memory 的反向链接时,会看到这条判断。AI 重新索引 vault 时,也能用链接关系辅助主题聚类。

3. 反向链接和未链接提及

Backlinks 会显示哪些笔记链接到了当前笔记。Outgoing links 会显示当前笔记链接出去的对象,以及未链接提及。官方文档里提到,未链接提及可以发现那些文本中出现了某个笔记名称、但还没有真正建立链接的位置。

这个能力很实用。比如你有一篇 RAG 概念笔记,后来在很多项目笔记里写过 RAG 但没有链接。未链接提及可以提醒你:这些材料也许应该纳入 RAG 的知识网络。

我的使用建议:

  • 概念笔记看 Backlinks,用来发现自己在哪些地方用过这个概念。
  • 项目笔记看 Outgoing links,用来检查是否遗漏了关键概念链接。
  • 每周处理一次未链接提及,不要每天被它打断。

4. Properties

Properties 是 Obsidian 里非常重要但常被低估的能力。官方文档说明,properties 用来组织笔记里的结构化数据,支持文本、链接、日期、复选框、数字等类型;它们以 YAML 格式存储在文件顶部。

一篇论文笔记可以这样写:

---
type: literature
source: https://example.com/paper
status: reading
confidence: medium
reviewed_at: 2026-04-28
tags:
  - ai-memory
  - retrieval
---

这些字段让笔记从“文章”变成“可筛选对象”。你以后可以搜索:

[type:literature] [status:reading]

或者建立 Bases 视图,把所有 type=literature 的笔记按 statusconfidencereviewed_at 排序。

我的推荐字段:

---
type: literature | concept | project | decision | experiment | source
status: inbox | reading | active | reviewed | archived
source:
confidence: low | medium | high
reviewed_at:
related:
tags:
---

注意不要把 properties 设计得太复杂。它适合小而稳定的元数据,不适合塞长段 Markdown。

Obsidian 的 Search 是核心插件,不只是简单关键字搜索。官方文档列出了一批搜索操作符,例如:

file:
path:
content:
tag:
line:
match-case:
ignore-case:

你可以这样查:

tag:#ai-memory path:"10-literature"

意思是在 10-literature 路径里找带 #ai-memory 的材料。

再比如:

content:"context compression" -path:"90-archive"

意思是找包含 context compression 的笔记,但排除归档区。

Search 还能用正则。例如:

path:/2026-\d{2}-\d{2}/

这适合查日期命名的文件。对大型 vault 来说,搜索能力比图谱更常用,因为你需要的是稳定找回,而不是视觉展示。

6. Graph view

Graph view 把笔记显示成节点,把内部链接显示成边。它适合回答这些问题:

  • 哪些概念已经形成密集关联?
  • 哪些笔记是孤立节点?
  • 某个主题附近有哪些相邻材料?
  • 一个项目牵涉了哪些论文、概念和决策?

但图谱不是知识质量指标。节点多、线多,只能说明链接多,不能说明理解深。对研究型 vault,我更建议使用 Local Graph,而不是整站大图。打开某篇核心概念笔记,查看它一跳或两跳范围内的材料,往往比看全局图更有用。

7. Canvas

Canvas 是 Obsidian 的无限画布,用来把笔记、卡片、图片和关系放到一个空间里。它适合处理“线性文章不好表达”的问题:

  • 一篇论文的方法结构。
  • 一个 AI 记忆系统的模块关系。
  • 多个开源项目的架构对比。
  • 一篇长文的提纲和证据链。

我建议把 Canvas 当作研究白板,而不是最终知识库。比如研究 Obsidian 时,可以建一个 Obsidian as memory system.canvas

左侧:主要能力
中间:底层技术
右侧:AI 记忆系统接法
下方:风险和失败模式

等结构稳定后,再把结论沉淀成 Markdown 笔记。Canvas 用来组织思考,Markdown 用来保存结论。

8. Bases

Bases 是 Obsidian 新一些的核心能力,官方帮助称它可以创建 database-like views of your notes。它可以基于 properties 建立表格或其他视图,也可以嵌入到笔记中。

一个研究库可以建这些 Bases:

  • Reading Queue:筛选 type=literaturestatus=reading
  • Reviewed Papers:筛选 type=literaturestatus=reviewed
  • Open Questions:筛选 type=question
  • Decisions:筛选 type=decision,按 reviewed_at 排序。

这让 Obsidian 具备轻量数据库的使用体验,但底层仍然是 Markdown 文件和 properties。它适合个人研究管理,不适合替代真正的业务数据库。

9. 核心插件和社区插件

Obsidian 内置了很多核心插件,例如 Backlinks、Canvas、Command palette、Daily notes、File recovery、Graph view、Outline、Page preview、Properties view、Search、Templates、Workspaces 等。核心插件已经足够支撑严肃使用。

我不建议一开始装很多社区插件。更稳的顺序是:

  1. 先用核心插件建立目录、链接、properties、搜索和模板。
  2. 确认自己的流程稳定后,再装少量插件补短板。
  3. 每个插件都要问:关掉它后,我的核心内容还读得懂吗?

如果答案是否定的,说明它已经从“工具”变成“锁定风险”。

一套可照着做的使用流程

下面是一套适合技术研究、AI 记忆系统和博客写作的 Obsidian 流程。

第一步:创建 vault 目录

建议先从 7 个目录开始:

00-inbox/
10-sources/
20-literature/
30-concepts/
40-projects/
50-decisions/
90-archive/

含义如下:

  • 00-inbox:临时捕获,不要求干净。
  • 10-sources:原始网页、论文链接、仓库链接、引用材料。
  • 20-literature:论文和长文阅读笔记。
  • 30-concepts:长期概念,比如 RAG、episodic memory、context compression。
  • 40-projects:项目实践、实验记录、部署记录。
  • 50-decisions:明确决策,记录为什么这样做。
  • 90-archive:过时材料,保留但降低优先级。

不要一开始建立几十个目录。目录越多,捕获越慢,维护成本越高。

第二步:准备 4 个模板

论文模板

---
type: literature
status: reading
source:
confidence: medium
reviewed_at:
tags:
  - ai-memory
---

# {{title}}

## 研究问题

## 方法

## 实验设置

## 关键结论

## 局限

## 对工程的启发

## 相关链接

- [[AI memory]]
- [[Memory evaluation]]

概念模板

---
type: concept
status: active
confidence: medium
reviewed_at:
tags:
---

# {{concept}}

## 定义

## 它解决什么问题

## 常见实现

## 容易误解的地方

## 相关材料

项目模板

---
type: project
status: active
source:
confidence: medium
reviewed_at:
tags:
---

# {{project}}

## 目标

## 当前架构

## 关键接口

## 运行方式

## 风险

## 下一步

决策模板

---
type: decision
status: reviewed
confidence: high
reviewed_at: 2026-04-28
tags:
---

# 决策:{{title}}

## 背景

## 选择

## 为什么不选其他方案

## 未来何时重新评估

这 4 类模板足够覆盖大多数研究工作。重点是让笔记能被自己复查,也能被 AI 索引器识别。

第三步:捕获材料,不急着整理

看到一篇论文、一条技术博客或一个 GitHub 仓库,先放进 00-inbox10-sources。不要在捕获阶段追求完美。

一个原始材料笔记可以很短:

---
type: source
status: inbox
source: https://github.com/example/project
tags:
  - ai-memory
---

# example/project

## 为什么值得看

可能和长期记忆检索有关。

## 待验证

- 是否有持久化层
- 是否支持删除或更新记忆
- 是否有评测脚本

这样做的好处是材料不会丢,但也不会污染正式概念库。

第四步:阅读时拆成三种笔记

不要把所有东西塞进一篇长笔记。读完一篇材料后,至少拆成三类:

  • source note:原始来源和摘录。
  • concept note:可复用概念。
  • decision note:你自己的判断。

例如读一篇关于长期记忆的论文,可以产生:

20-literature/LoCoMo benchmark.md
30-concepts/Long-term memory evaluation.md
50-decisions/为什么博客文章需要标注来源和局限.md

这比一篇 5000 字杂糅笔记更适合长期复用。AI 后续检索时,也更容易拿到干净上下文。

第五步:用链接表达关系

每篇正式笔记至少要有 3 类链接:

  • 上位概念:这篇笔记属于哪个大主题。
  • 相邻材料:和哪篇论文、仓库、文章有关。
  • 输出结果:这条材料最后支持了哪个决策或文章。

示例:

## 相关链接

- 上位概念:[[AI memory]]
- 相邻材料:[[RAG]], [[Context compression]], [[Memory evaluation]]
- 输出结果:[[决策:把 Obsidian 作为 AI 记忆源]]

链接不是装饰,它是你的人工知识图谱。

第六步:用搜索和 Bases 做复盘

每周可以查这些搜索:

[status:inbox]

找还没处理的材料。

[type:literature] [status:reading]

找读到一半的论文。

tag:#ai-memory -path:"90-archive"

找当前有效的 AI memory 材料。

content:"TODO" -path:"90-archive"

找未完成任务。

如果你已经开始用 Bases,就把这些查询做成视图。这样每次打开 Obsidian 都能看到“哪些材料需要处理”,而不是凭记忆翻文件。

第七步:用 Canvas 组织复杂文章

写复杂文章前,我建议先建 Canvas:

中心:文章主问题
左侧:官方文档和事实来源
右侧:自己的判断
上方:技术机制
下方:失败模式和指标

对于本文,Canvas 可以这样组织:

Obsidian 是什么
  -> Markdown vault
  -> Links / Backlinks
  -> Properties
  -> Search / Bases
  -> Plugin API
  -> AI memory pipeline

当 Canvas 结构稳定,再写成文章。这样文章会比直接从头写更有骨架。

Obsidian 用到的技术

本地文件系统和 Markdown

Obsidian 的核心技术选择是本地文件加 Markdown。它不把知识存成不可读的云端对象,而是把文件系统作为长期存储层。对个人记忆系统来说,这解决了三个问题:

  • 数据可迁移。
  • 数据可版本化。
  • 数据可被外部程序读取。

这也是为什么它适合和 Git、静态博客、全文搜索、向量索引、脚本自动化配合。

链接解析和元数据索引

Obsidian 能显示反向链接、图谱、未链接提及、properties view,本质上需要持续解析 vault 里的 Markdown、链接、frontmatter、标签和文件路径。

它并不是只打开当前文件,而是在应用层维护了一套 metadata cache。插件也可以基于这些解析结果工作。对 AI 系统来说,这一层很有价值:它已经把纯文本材料提升成“有路径、有链接、有标签、有属性”的半结构化知识库。

CodeMirror 编辑器

Obsidian 开发者文档说明,它使用 CodeMirror 作为底层文本编辑器,并通过自己的 Editor API 暴露编辑能力。CodeMirror 的存在让 Obsidian 能实现:

  • Live Preview。
  • 编辑器命令。
  • 选区操作。
  • 插件增强。
  • 编辑器视图扩展。

这也是为什么它既像 Markdown 编辑器,又能拥有接近 IDE 的扩展能力。

TypeScript 插件 API

Obsidian 插件使用 TypeScript 开发。开发者可以通过 Vault API 访问文件,通过 Editor API 操作编辑器,通过 Workspace 管理界面和视图。

官方 Vault 文档示例展示了读取所有 Markdown 文件、缓存读取、修改文件等操作。这说明 Obsidian 插件可以直接围绕本地知识库做自动化,例如:

  • 批量扫描笔记。
  • 生成索引页。
  • 重写 properties。
  • 调用本地或远端模型摘要笔记。
  • 把笔记导出到向量库。

这也是它能成为 AI 工作流入口的原因之一。

Canvas 和 Bases

Canvas 是空间化组织层,适合表达非线性关系。Bases 是基于 properties 的数据库式视图,适合管理状态和列表。

它们的共同点是:不改变底层知识源,而是在同一批文件上创建不同视图。这个设计很重要。好的记忆系统不应该把数据复制成十份,而应该在同一份源数据上创建不同索引和视图。

Sync 和加密

Obsidian Sync 的安全说明提到,远端 vault 和通信会加密;新建远端 vault 时,端到端加密是默认选项。文档还说明其技术细节包括 scrypt 派生密钥,以及 AES-256-GCM 加密。

但要注意:这不代表本地 vault 自动加密。本地安全仍然取决于你的系统账号、磁盘加密和备份策略。

和 AI 记忆系统怎么接

我建议的接法不是“让 AI 随便写 Obsidian”,而是把 Obsidian 作为审查后的源材料层:

捕获材料
  -> Obsidian 整理
  -> 人类审查 status/confidence/source
  -> 脚本抽取 Markdown
  -> 全文索引 + 向量索引
  -> AI 检索使用
  -> 错误回写 Obsidian

这个流程里,Obsidian 保存的是可审查原文。AI 真正使用时,可以从 Obsidian 导出或读取:

  • 文件路径。
  • 标题。
  • properties。
  • 正文块。
  • 内部链接。
  • 来源 URL。
  • 最近更新时间。

然后建立索引。索引层可以是 SQLite FTS、Postgres、Meilisearch、Typesense、向量数据库,或者简单的本地脚本。

关键约束是:AI 回答必须能回链到 Obsidian 原文。否则你只是把一个可审计系统变成了新的黑箱。

Obsidian 适合什么,不适合什么

适合:

  • 论文阅读和开源项目研究。
  • 个人项目知识库。
  • 长期博客素材库。
  • AI 助手的人工审查记忆源。
  • 需要本地优先、可迁移、可版本化的个人知识系统。

不适合:

  • 多人实时协作写作。
  • 强权限、强审计的企业知识管理。
  • 高频事务型业务数据库。
  • 大规模线上检索服务。
  • 完全自动化、无人审查的 AI 记忆写入。

这不是 Obsidian 的缺点,而是边界。它适合个人和小团队的知识工作台,不适合替代业务系统。

常见错误

错误一:把 inbox 当知识库

只收藏不整理,最后 vault 会变成浏览器书签的另一个副本。解决方法是给每条材料一个状态:

status: inbox | reading | reviewed | archived

每周只处理 status: inbox 的内容。

错误二:标签太多

标签应该帮助检索,而不是表达情绪。#好文#以后看#重要 通常会失控。更好的标签是稳定主题:

#ai-memory
#rag
#obsidian
#evaluation
#postgres

错误三:链接没有语义

不要为了链接而链接。每个链接最好能回答:为什么它们有关?

差的写法:

相关:[[AI]] [[工具]] [[笔记]]

好的写法:

Obsidian 适合作为 [[AI memory]] 的人类审查层,因为它的 Markdown vault 可以被重新索引。

错误四:插件过载

插件可以增强效率,但插件越多,迁移风险越大。判断标准很简单:关掉插件后,核心内容还是否可读?如果不可读,就要谨慎。

错误五:AI 自动写入未审查内容

如果让 AI 自动把对话摘要、用户偏好和结论写进 Obsidian,却没有 sourceconfidencereviewed_at,下一次检索时就可能把旧幻觉当成事实。

可验证指标

判断一个 Obsidian vault 是否真正成为记忆系统,可以看这些指标:

  • 关键结论是否有来源。
  • 重要笔记是否有 properties。
  • 一分钟内能否找回某个项目决策。
  • 概念笔记是否能通过 backlinks 找到实际使用场景。
  • inbox 是否长期堆积。
  • 归档区是否排除在日常检索之外。
  • AI 使用的上下文是否能回链到原文。
  • 关掉社区插件后,核心知识是否仍可读。

如果这些指标成立,Obsidian 就不只是“笔记软件”,而是一个小型、透明、可迁移的个人记忆系统。

工程结论

Obsidian 的核心能力可以总结为:

  • 用 Markdown 文件承载长期内容。
  • 用链接和反向链接表达显式关系。
  • 用 properties 给笔记加轻量 schema。
  • 用 Search、Graph、Canvas、Bases 建立不同检索和组织视图。
  • 用 TypeScript 插件 API 连接自动化和 AI 工作流。
  • 用同步和加密方案解决多端访问,但本地安全仍需自己负责。

如果你要研究 AI 记忆系统,Obsidian 值得重点看,不是因为它本身很“智能”,而是因为它提供了一个朴素但可靠的事实:长期记忆首先要能被人读懂、修改、迁移和验证。AI 可以参与召回和总结,但记忆源最好仍然保持可审计。

自审

  • 事实可靠性:核心事实来自 Obsidian 官方帮助、开发者文档和同步安全说明。
  • 来源完整性:覆盖数据存储、核心插件、内部链接、反向链接、properties、搜索、图谱、Bases、Canvas、Vault API、Editor API 和同步加密。
  • 原创性:文章重点是具体使用流程、技术能力拆解和 AI 记忆系统接法,不复述官方教程。
  • 标题风险:标题描述 Obsidian 的使用和技术定位,不宣称它能自动解决个人知识管理。
  • 薄内容检查:包含主要能力、使用步骤、模板、搜索语法、技术层、适用边界、错误模式和评估指标。
  • 猜测边界:未把图谱、插件或同步能力夸大成自动推理、数据库或企业权限系统。
  • 站内重复:与基础设施化 AI memory 文章不同,本文聚焦个人知识库和可审计记忆源。