我是怎么一步步搭出这套自建知识系统的
说实话,一开始我也只是想找个“好用的笔记工具”。
用过 Notion,用过各种稍后读,也折腾过一堆剪藏插件。刚开始都挺爽,但用久了就会遇到同一个问题:
东西越来越多,但真正能用的越来越少。
后来我才意识到,我缺的不是工具,而是一个流程。
这套流程现在大概是这样:
- 用服务器部署
Hoarder/Karakeep,作为剪藏、稍后读、网页保存和临时标注的中转站。 - 在浏览器端使用
Karakeep浏览器插件,在Android端通过系统分享菜单快速剪藏。 - 用
Hoarder Sync把筛选后的内容定时同步到Obsidian。 - 用
Obsidian作为长期知识库,承担日常笔记、结构化整理、写作素材沉淀和输出。 - 用
Self-hosted LiveSync+CouchDB实现Windows与Android端Obsidian Vault的实时同步。 - 用本地设备、个人服务器、
坚果云形成三端备份,尽量避免数据只存在某一个地方。
换句话说,这不是一个单一应用方案,而是一套个人知识基础设施。
说明:Hoarder 项目现在已经逐步更名为 Karakeep。为了兼容旧教程、旧插件和现有使用习惯,本文统一写作 Hoarder/Karakeep。

一、最开始踩的坑:把 Obsidian 当收集工具
我最早是直接用 Obsidian + Web Clipper。
看到好文章,一键剪进去,当下确实很爽。
但问题很快就来了:
Vault里堆满了几十、上百篇文章。- 大部分内容基本没看过。
- 真正整理过、引用过、写进文章里的内容很少。
Obsidian的目录越来越乱,搜索结果也越来越嘈杂。
那一刻我意识到一件事:
Obsidian不适合做所有信息的入口,它更像长期知识的终点。
Obsidian 的优势不是“什么都收”,而是适合做:
- 日常笔记。
- 项目笔记。
- 主题整理。
- 长期知识沉淀。
- 写作素材管理。
- 知识之间的链接和复用。
如果把所有网页、碎片、待读材料都直接塞进 Obsidian,它很容易从知识库变成第二个收藏夹。
二、为什么我后来引入 Hoarder/Karakeep
后来我开始用 Hoarder/Karakeep,初衷其实很简单:
我需要一个中转站,而不是让所有东西直接进入笔记库。
用了之后才发现,这一步非常关键。
1. 把看到的东西先兜住
以前的流程是:
- 看到了。
- 想一下要不要记。
- 犹豫要不要打开
Obsidian。 - 最后经常放弃。
现在的流程是:
- 看到了。
- 浏览器插件或
Android分享到Hoarder/Karakeep。 - 先放进去,后面再处理。
这个差别很大,因为它降低了收集的心理成本。
收集阶段最重要的不是整理得多好,而是不要让有价值的信息在当下流失。
2. 自动完成第一轮粗整理
Hoarder/Karakeep 会帮我做几件基础工作:
- 保存网页。
- 提取正文。
- 保留原链接。
- 生成摘要。
- 添加标签。
- 记录临时标注和备注。
这一步不一定特别智能,但已经够用了。
至少它把“完全没有整理”的状态,变成了“有正文、有摘要、有标签、有上下文”的状态。
3. 给我一个缓冲区
这是我认为最关键的一点。
现在我的习惯是:
- 所有外部内容先进
Hoarder/Karakeep。 - 在
Hoarder/Karakeep里完成第一轮筛选。 - 只有真正有价值的内容,才进入
Obsidian。
也就是说:
Hoarder/Karakeep是缓冲区和筛选器,不是最终知识库。
这个定位一旦清楚,整个系统就不容易乱。
三、同步到 Obsidian:只让值得留下的内容进入知识库
后来我接上了 Hoarder Sync,把剪藏内容同步到 Obsidian。
一开始我也犯过一个很典型的错误:全量同步。
结果就是:
Hoarder/Karakeep里有什么,Obsidian里就有什么。Obsidian又变成第二个垃圾场。- 原本想解决的问题,只是换了一个地方继续发生。
后来我改成一个简单规则:
只有经过我筛选的内容,才进入
Obsidian。
如果同步插件和配置支持筛选,我更倾向于只同步标星、指定标签或指定列表中的内容。如果配置条件有限,也要至少让同步内容先进入统一 Inbox,而不是直接进入最终知识目录。

我现在的实际流程是:
- 浏览器或手机看到内容。
- 通过
Karakeep插件或Android分享扔进Hoarder/Karakeep。 - 有时间再回看。
- 判断它是否真的值得保留。
- 有价值的内容标星或打上指定标签。
- 通过
Hoarder Sync定时同步到Obsidian。 - 在
Obsidian Inbox中进行二次整理。
这个流程的核心不是“同步”,而是“筛选”。
同步只是技术动作,筛选才是知识系统的质量控制。
四、进入 Obsidian 之后,才是真正的知识工作
很多人觉得剪藏完成就结束了。
其实不是。
剪藏只是收集,不是学习。
对我来说,Obsidian 承担的是后半段工作:理解、改写、链接和输出。
1. 简单标注
一篇文章同步进来之后,我通常不会马上大改,而是先补几句判断:
- 这篇文章主要讲了什么。
- 哪一段对我有用。
- 它和我正在研究的问题有什么关系。
- 以后可能用在哪类文章或项目里。
这一步看起来简单,但很重要。
因为它把 **“别人的内容”变成了“我能重新理解的材料”**。
2. 拆分内容
有些文章很长,我不会原封不动留着。
更常见的做法是:
- 把一篇长文拆成几个独立观点。
- 把每个观点放到对应主题笔记里。
- 对无关部分直接删掉或归档。
- 保留原文链接,方便回溯来源。
这样做之后,Obsidian 里留下的不是一堆完整网页,而是可以继续组合、引用和输出的知识单元。
3. 建立连接
这是 Obsidian 最有价值的地方。
我会把新内容连接到旧笔记,比如:
- 某个主题。
- 某个项目。
- 某篇正在写的文章。
- 某个长期关注的问题。
- 某个已经存在的观点或反例。
知识不是靠收藏变多的,而是靠连接变得可用。
五、多端同步:为什么我坚持自建
我现在用的是:
Self-hosted LiveSync。Apache CouchDB。
这部分折腾成本不低,但我还是坚持自建,原因很现实。

1. 我不想被某一个同步服务绑定
很多同步服务的问题是:一旦你用深了,迁移成本会越来越高。
我希望知识库的核心数据仍然是普通 Markdown 文件、附件和本地 Vault。同步服务可以替换,但数据本身不能被锁死。
2. 我希望离线也能用
自建同步之后,本地就是完整数据。
网络只是同步工具,不是访问知识库的前提。
这点对我很重要。因为笔记系统如果必须联网才能正常使用,它就不再是稳定的个人基础设施。
3. 我想控制同步链路
Self-hosted LiveSync + CouchDB 的好处是同步中枢在自己的服务器上。
我可以控制:
- 数据库部署位置。
- 访问方式。
- 备份方式。
- 同步策略。
- 故障恢复路径。
但这里有一个重要原则:
同一个
Obsidian Vault最好只保留一个实时同步主通道。
也就是说,Self-hosted LiveSync 用来做 Windows 与 Android 之间的实时同步。坚果云 更适合做备份或归档,不建议和 LiveSync 一起对同一个 Vault 做实时双向编辑同步。
否则可能出现:
- 重复文件。
- 冲突文件。
- 旧版本覆盖新版本。
- 插件状态和文件状态不一致。
- 同步链路出错后很难判断责任来源。
六、备份这件事,我是被教育过的
以前我是不认真做备份的。
后来有一次数据出问题,我才意识到:
知识库是资产,不是工具。
工具坏了可以换,知识库丢了很难恢复。
所以现在我的做法很简单,但相对稳:
- 本地一份。
- 服务器一份。
坚果云一份。

这里要注意一件事:
仅仅备份 Obsidian Vault,不等于备份了整套系统。
真正需要纳入备份的至少有三类数据:
| 数据 | 内容 | 作用 |
|---|---|---|
Obsidian Vault |
Markdown、附件、图片、模板、配置 |
长期知识库主数据 |
Hoarder/Karakeep 数据 |
剪藏文章、网页快照、标签、备注、上传文件 | 信息入口和稍后读数据 |
CouchDB 数据 |
LiveSync 同步数据库、文档版本、同步状态 |
多端同步中枢 |
我的理解是:
- 本地备份解决误删、误改、插件异常。
- 服务器备份解决服务迁移、数据库恢复、容器故障。
坚果云备份解决异地容灾和最后一道恢复保障。
备份不是为了看起来安心,而是为了在出问题时真的能恢复。
所以后续还要定期做恢复演练,至少确认几件事:
Vault能否从备份中打开。- 附件是否完整。
Hoarder/Karakeep数据能否重新挂载。CouchDB数据是否能重新用于LiveSync。- 服务器配置是否有文档或脚本可复现。
七、我现在的目录和工作区设计
我不建议让 Hoarder/Karakeep 同步过来的内容直接进入最终知识目录。
更稳妥的方式是先进入 Inbox。
我现在更倾向于这样的结构:
Vault/
00_Inbox/
WebClips/
MobileCaptures/
10_Daily/
20_Projects/
30_Areas/
40_Resources/
50_PermanentNotes/
90_Archive/
assets/
对应规则是:
Hoarder Sync同步内容先进00_Inbox/WebClips/。- 手机临时记录进入
00_Inbox/MobileCaptures/或日记目录。 - 每天只做轻筛选,不强求深度整理。
- 每周集中清理
Inbox,把真正有价值的内容移到项目、领域、资源或永久笔记。 - 附件尽量集中管理,避免后续同步和备份时散落到不可控位置。
这里有一个判断标准:
只有经过改写、拆分、链接和上下文补充的内容,才算真正进入知识库。
否则它只是剪藏材料。
八、这套系统带来的改变
最明显的变化其实不是效率提升,而是信息关系变清楚了。
1. 不再焦虑信息
以前看到好东西会怕丢。
现在看到内容,先丢进 Hoarder/Karakeep。
它不一定马上有用,但至少不会打断我当前的工作流。
2. 知识开始积累
过去我以为收藏数量变多,就是知识积累。
后来发现不是。
真正的积累发生在:
- 我筛掉了不重要的内容。
- 我理解了重要内容。
- 我把它改写成自己的话。
- 我把它连接到已有知识。
- 我在写作或项目中重新使用它。
3. 写东西更轻松
现在写文章时,我不再从零开始。
需要的素材通常已经在 Obsidian 里,而且是经过筛选和整理的。
这会让写作从 **“临时找资料”,变成“调用已有知识”**。
九、如果你也想搭这套系统,我的建议
我不建议一上来就照搬全部。
更稳的顺序是从流程开始,而不是从部署开始。
第一步:先用 Hoarder/Karakeep 做收集
先不要急着动 Obsidian。
先让自己养成一个习惯:看到值得保留的内容,统一进入 Hoarder/Karakeep。
目标是降低收集成本,而不是马上搭完整系统。
第二步:养成筛选习惯
可以先用最简单的规则:
- 标星表示值得留下。
- 标签表示主题方向。
- 备注表示为什么有用。
这一步比插件配置更重要。
因为没有筛选习惯,任何同步都会把垃圾同步到下一个地方。
第三步:再接 Hoarder Sync 到 Obsidian
等你已经能稳定筛选内容之后,再把 Hoarder/Karakeep 接到 Obsidian。
同步策略建议尽量克制:
- 能只同步标星,就不要全量同步。
- 能同步指定标签,就不要同步所有标签。
- 能先进入
Inbox,就不要直接进入最终目录。
第四步:最后再折腾 LiveSync 和备份
实时同步和自建服务器属于后半段。
如果你还没有稳定的知识流程,先不要急着上 CouchDB 和 LiveSync。
更合理的顺序是:
- 先把收集流程跑通。
- 再把筛选流程跑通。
- 再把
Obsidian整理流程跑通。 - 最后再做多端实时同步和三端备份。
技术架构应该服务于流程,而不是反过来让流程迁就技术。
十、最后说一句
这套系统最重要的,不是 Hoarder/Karakeep,也不是 Obsidian。
真正重要的是你愿不愿意持续做三件事:
- 筛选。
- 理解。
- 重写。
如果没有这三步,再好的系统也只是一个更高级的收藏夹。
但如果能坚持下来,这套系统会慢慢变成一件很有意思的东西。
它不只是帮你存东西,而是开始帮你形成自己的知识判断。
参考来源
- Karakeep 官方文档:https://docs.karakeep.app/
- Karakeep 官方仓库:https://github.com/karakeep-app/karakeep
- Self-hosted LiveSync 官方仓库:https://github.com/vrtmrz/obsidian-livesync
- Self-hosted LiveSync 自建 CouchDB 文档:https://github.com/vrtmrz/obsidian-livesync/blob/main/docs/setup_own_server.md