都在研究Karpathy的知识库自动生长，可多数人都被卡在高效输入的第一步

退休探索日记·第18天 | 今天是2026年4月18日，星期六晴

字数：约1200字 | 预计阅读时间：3分钟

theme_large_900x383_96fb5c2e5b6c41ee9e828636854ad77f_3e1f32ad.webp

📚 今日见闻/学习

这两天Obsidian圈子最火的话题，就是怎么让知识库自己生长。

Karpathy（AI大神，OpenAI创始成员之一）提出了一个叫LLM Wiki的方法——让AI持续编译你的笔记，把碎片信息自动变成结构化知识。很多教程讲得很漂亮：数据层、编译层、浏览层，三层架构，听着像魔法。

我刚接触Obsidian不久，看到这些方案也很兴奋，跟着研究了一阵子。

然后有一天我突然意识到一个问题——

我的知识库里，到底有多少可供AI"编译"的原材料？

翻了一圈，答案让我愣住了：没多少。

有价值的信息散得到处都是：微信收藏夹里攒了几百条从没打开过的文章、浏览器书签里一堆"以后看"、flomo里躺着的闪记、还有那些当时觉得好但再也想不起来找的好内容。

这就好比——你花了很多心思装修了一个漂亮的书房，书架分好了类、标签贴好了、灯光调好了。然后你发现，架上没几本书。

💡 核心发现：没有输入，就没有生长

我这几天一直在研究Karpathy提出的LLM Wiki方法，看了一大堆教程和方案。核心思路都一样：

原始资料 → AI编译整理 → 结构化Wiki
   (数据层)     (编译层)        (浏览层)

方案很漂亮，三层架构，自动进化，听起来像魔法一样。

但我回头一看自己的知识库，发现一个问题——我的数据层太薄了。

每天真正进入知识库的新内容，少得可怜。大部分时候是：

看到好文章 → 想着"回头再整理" → 然后……没有然后了
手机上刷到有用的内容 → 截个图存flomo → flomo里躺了几百条没动过
公众号看到深度好文 → 收藏到微信收藏夹 → 从此消失在收藏夹黑洞里

后来我找到了一个工具——Obsidian Web Clipper。

它是什么？

Obsidian官方出的浏览器剪藏插件，免费、开源。装在浏览器上，一键把网页内容保存到本地笔记库里，格式是Markdown。

官方下载地址：https://obsidian.md/zh/clipper

支持这些浏览器：
| 浏览器 | 下载链接 |
|--------|---------|
| Chrome | Chrome 商店 |
| Edge | Edge 加载项 |
| Safari | App Store |
| Firefox | Firefox 附加组件 |

（Brave、Arc、Vivaldi等Chromium内核浏览器也可以通过Chrome商店链接安装）

两大核心功能

功能一：Capture（捕获网页）

点击浏览器上的Obsidian图标，就能把网页内容抓下来存到本地。支持几种方式：

页面模式：保存整篇文章，自动转为Markdown格式，图片、链接都保留
选区模式：只保存你选中的部分——只要某一段、某个表格、某张图
书签模式：只记标题+链接+摘要，先收藏以后细看

功能二：Highlight（高亮标注）

这是我最喜欢的功能。边读网页可以边高亮重要段落，高亮的内容能一键存到Obsidian里。下次再打开同一页面，之前的高亮还在。

最强的地方：模板系统

这是Web Clipper真正厉害的地方——它不只是"存网页"，而是按结构存。

它内置了几种模板：

模板	适用场景	自动提取的信息
文章模板	博客、新闻	标题、作者、发布日期、来源链接
参考资料模板	书籍、电影、播客	导演/演员、评分、时长、类型
学术论文模板	论文、研究	作者、发表时间、公式代码
自定义模板	你自己定义	想提取什么就提取什么

举个例子：用"文章模板"剪藏一篇公众号文章，存下来的文件会自带标题、来源URL、发布时间、标签等信息。不用手动补，全自动化。

它解决了什么问题？

以前我看到好内容，流程是这样的：

觉得好 → 复制粘贴到Obsidian
格式乱了 → 手动调整排版
图片丢了 → 回去重新截图
来源忘了 → 再打开网页找链接
折腾10分钟 → 不想存了

现在：

点一下浏览器图标 → 选择模式 → 完成
Markdown格式自动转换，元数据自动记录，来源自动标注
全程5秒

从"懒得存"变成"顺手就存"，这个体验差距就是信息收集的天堑。

我的真实使用记录

装上之后，说说我实际的用法：

场景一：公众号文章
在浏览器里打开公众号文章（注意：微信客户端里没法直接用），读完觉得好，点Clipper图标，选"页面"→ 用"文章模板"→ 整篇自动存到知识库。格式干干净净，标题、来源、日期全都有。

场景二：只要一个数据表
投资分析文章里的对比表格很有价值，但整篇文章不需要。选中表格 → 选"选区模式" → 只有表格进来，干净利落。

场景三：先收藏以后看
遇到长文但没时间细读，选"书签模式"——只记标题和链接，等有空了再回来精读剪藏。

最大的改变是什么？

以前我知识库的输入靠"主动记忆"——我得记得去存、去整理。人的记忆是不可靠的，结果就是存得越来越少。

现在是被动积累——看到好的随手一点，不知不觉中素材越来越多了。

这不就是Karpathy说的"数据层"吗？数据层厚了，后面的AI编译才有东西可以嚼。

使用帮助文档：https://obsidian.md/zh/help/web-clipper

📈 市场观察/投资思考

写到这儿，我突然想到一件事——这跟我做投资的逻辑一模一样。

很多人问我："你怎么找到好标的？"

我说：不是找到的，是日常积累的。

我有个习惯，每天看市场资讯时把有价值的信息顺手丢进笔记里。ETF的行业配置、宏观政策信号、北向资金动向……日积月累，攒了自己的"数据库"。

等到要决策的时候，我不是临时去搜信息——我是从已有笔记里调取认知。

知识库也一样。不是等到要用的时候才去找资料，而是平时看到好的就顺手存下来。量变引起质变，存到一定程度，你自然能看到别人看不到的东西。

这就是段永平说的"能力圈"——不是一天扩出来的，是一天天积累出来的。

💡 深度思考/跨界联想

我想聊聊"土专家"这件事。

我用Obsidian以来，很多功能还在持续摸索中。但我不怕慢，因为有个习惯：

遇到新工具，先搞清楚底层逻辑再上手。

比如Web Clipper，我没上来就用，而是先搞明白：

它怎么跟Obsidian通信？（通过Local REST API接口）
数据存到哪里？（我自己指定的文件夹）
格式怎么转的？（HTML自动转Markdown）

知道这些之后，出了问题我能排查，换工具我能迁移，不会被任何一个产品绑定死。

这跟我2024年学Python是一样的——快60岁的人，既非软件专业也不搞代码，白天管公司运营，晚上敲代码，不懂就问AI助手。

当时很多人说"都快退休了学这个干什么"。

我说：正因快退休了，才更要为未来做准备。

现在回头看，那些看似"没用"的积累，让我今天能快速理解这些工具的逻辑，能在一周内把Obsidian玩起来，能写出这些分享给粉丝。

所有看似无用的积累，都会在某个时刻连成线。

OPC创业也一样——不追热点，搞懂底层，用认知为别人试错。

⚠️ 安全提醒 & 一个小预告

最近Elastic Security Labs发布了报告，有人利用Obsidian插件投放木马病毒（代号REF6598）。手段是通过社交工程诱导受害者开启恶意插件的同步功能。

这件事提醒我们：装插件前花一分钟看看它在干什么，这个习惯值得保持。

不过话说回来，像Web Clipper这种"只写文件不执行命令"的低风险插件，相对还是安全的。

另外说一句： 后面我会把自己用过觉得好用的Obsidian插件陆续分享出来，帮大家省得一个个去踩坑筛选。毕竟插件2500多个，确实不好挑。哪些真有用、哪些是噱头，我用过了才知道。（这块我也会整理成系统的内容，感兴趣的后面关注就行）

今天就到这儿！

你平时用什么方式收藏网页内容？有没有遇到过"收藏了一堆但从没看过"的情况？

如果让你给知识库选一个"输入工具"，你会选什么？

聊聊呗~ 😊

所有留言和来信本人必回！