都在研究Karpathy的知识库自动生长,可多数人都被卡在高效输入的第一步
退休探索日记·第18天 | 今天是2026年4月18日,星期六 晴
字数:约1200字 | 预计阅读时间:3分钟

📚 今日见闻/学习
这两天Obsidian圈子最火的话题,就是怎么让知识库自己生长。
Karpathy(AI大神,OpenAI创始成员之一)提出了一个叫LLM Wiki的方法——让AI持续编译你的笔记,把碎片信息自动变成结构化知识。很多教程讲得很漂亮:数据层、编译层、浏览层,三层架构,听着像魔法。
我刚接触Obsidian不久,看到这些方案也很兴奋,跟着研究了一阵子。
然后有一天我突然意识到一个问题——
我的知识库里,到底有多少可供AI"编译"的原材料?
翻了一圈,答案让我愣住了:没多少。
有价值的信息散得到处都是:微信收藏夹里攒了几百条从没打开过的文章、浏览器书签里一堆"以后看"、flomo里躺着的闪记、还有那些当时觉得好但再也想不起来找的好内容。
这就好比——你花了很多心思装修了一个漂亮的书房,书架分好了类、标签贴好了、灯光调好了。然后你发现,架上没几本书。
💡 核心发现:没有输入,就没有生长
我这几天一直在研究Karpathy提出的LLM Wiki方法,看了一大堆教程和方案。核心思路都一样:
原始资料 → AI编译整理 → 结构化Wiki
(数据层) (编译层) (浏览层)
方案很漂亮,三层架构,自动进化,听起来像魔法一样。
但我回头一看自己的知识库,发现一个问题——我的数据层太薄了。
每天真正进入知识库的新内容,少得可怜。大部分时候是:
看到好文章 → 想着"回头再整理" → 然后……没有然后了
手机上刷到有用的内容 → 截个图存flomo → flomo里躺了几百条没动过
公众号看到深度好文 → 收藏到微信收藏夹 → 从此消失在收藏夹黑洞里
后来我找到了一个工具——Obsidian Web Clipper。
它是什么?
Obsidian官方出的浏览器剪藏插件,免费、开源。装在浏览器上,一键把网页内容保存到本地笔记库里,格式是Markdown。
官方下载地址:https://obsidian.md/zh/clipper
支持这些浏览器:
| 浏览器 | 下载链接 |
|--------|---------|
| Chrome | Chrome 商店 |
| Edge | Edge 加载项 |
| Safari | App Store |
| Firefox | Firefox 附加组件 |
(Brave、Arc、Vivaldi等Chromium内核浏览器也可以通过Chrome商店链接安装)
两大核心功能
功能一:Capture(捕获网页)
点击浏览器上的Obsidian图标,就能把网页内容抓下来存到本地。支持几种方式:
页面模式:保存整篇文章,自动转为Markdown格式,图片、链接都保留
选区模式:只保存你选中的部分——只要某一段、某个表格、某张图
书签模式:只记标题+链接+摘要,先收藏以后细看
功能二:Highlight(高亮标注)
这是我最喜欢的功能。边读网页可以边高亮重要段落,高亮的内容能一键存到Obsidian里。下次再打开同一页面,之前的高亮还在。
最强的地方:模板系统
这是Web Clipper真正厉害的地方——它不只是"存网页",而是按结构存。
它内置了几种模板:
举个例子:用"文章模板"剪藏一篇公众号文章,存下来的文件会自带标题、来源URL、发布时间、标签等信息。不用手动补,全自动化。
它解决了什么问题?
以前我看到好内容,流程是这样的:
觉得好 → 复制粘贴到Obsidian
格式乱了 → 手动调整排版
图片丢了 → 回去重新截图
来源忘了 → 再打开网页找链接
折腾10分钟 → 不想存了
现在:
点一下浏览器图标 → 选择模式 → 完成
Markdown格式自动转换,元数据自动记录,来源自动标注
全程5秒
从"懒得存"变成"顺手就存",这个体验差距就是信息收集的天堑。
我的真实使用记录
装上之后,说说我实际的用法:
场景一:公众号文章
在浏览器里打开公众号文章(注意:微信客户端里没法直接用),读完觉得好,点Clipper图标,选"页面"→ 用"文章模板"→ 整篇自动存到知识库。格式干干净净,标题、来源、日期全都有。
场景二:只要一个数据表
投资分析文章里的对比表格很有价值,但整篇文章不需要。选中表格 → 选"选区模式" → 只有表格进来,干净利落。
场景三:先收藏以后看
遇到长文但没时间细读,选"书签模式"——只记标题和链接,等有空了再回来精读剪藏。
最大的改变是什么?
以前我知识库的输入靠"主动记忆"——我得记得去存、去整理。人的记忆是不可靠的,结果就是存得越来越少。
现在是被动积累——看到好的随手一点,不知不觉中素材越来越多了。
这不就是Karpathy说的"数据层"吗?数据层厚了,后面的AI编译才有东西可以嚼。
使用帮助文档:https://obsidian.md/zh/help/web-clipper
📈 市场观察/投资思考
写到这儿,我突然想到一件事——这跟我做投资的逻辑一模一样。
很多人问我:"你怎么找到好标的?"
我说:不是找到的,是日常积累的。
我有个习惯,每天看市场资讯时把有价值的信息顺手丢进笔记里。ETF的行业配置、宏观政策信号、北向资金动向……日积月累,攒了自己的"数据库"。
等到要决策的时候,我不是临时去搜信息——我是从已有笔记里调取认知。
知识库也一样。不是等到要用的时候才去找资料,而是平时看到好的就顺手存下来。量变引起质变,存到一定程度,你自然能看到别人看不到的东西。
这就是段永平说的"能力圈"——不是一天扩出来的,是一天天积累出来的。
💡 深度思考/跨界联想
我想聊聊"土专家"这件事。
我用Obsidian以来,很多功能还在持续摸索中。但我不怕慢,因为有个习惯:
遇到新工具,先搞清楚底层逻辑再上手。
比如Web Clipper,我没上来就用,而是先搞明白:
它怎么跟Obsidian通信?(通过Local REST API接口)
数据存到哪里?(我自己指定的文件夹)
格式怎么转的?(HTML自动转Markdown)
知道这些之后,出了问题我能排查,换工具我能迁移,不会被任何一个产品绑定死。
这跟我2024年学Python是一样的——快60岁的人,既非软件专业也不搞代码,白天管公司运营,晚上敲代码,不懂就问AI助手。
当时很多人说"都快退休了学这个干什么"。
我说:正因快退休了,才更要为未来做准备。
现在回头看,那些看似"没用"的积累,让我今天能快速理解这些工具的逻辑,能在一周内把Obsidian玩起来,能写出这些分享给粉丝。
所有看似无用的积累,都会在某个时刻连成线。
OPC创业也一样——不追热点,搞懂底层,用认知为别人试错。
⚠️ 安全提醒 & 一个小预告
最近Elastic Security Labs发布了报告,有人利用Obsidian插件投放木马病毒(代号REF6598)。手段是通过社交工程诱导受害者开启恶意插件的同步功能。
这件事提醒我们:装插件前花一分钟看看它在干什么,这个习惯值得保持。
不过话说回来,像Web Clipper这种"只写文件不执行命令"的低风险插件,相对还是安全的。
另外说一句: 后面我会把自己用过觉得好用的Obsidian插件陆续分享出来,帮大家省得一个个去踩坑筛选。毕竟插件2500多个,确实不好挑。哪些真有用、哪些是噱头,我用过了才知道。(这块我也会整理成系统的内容,感兴趣的后面关注就行)
今天就到这儿!
你平时用什么方式收藏网页内容?有没有遇到过"收藏了一堆但从没看过"的情况?
如果让你给知识库选一个"输入工具",你会选什么?
聊聊呗~ 😊
所有留言和来信本人必回!