向量检索

几个先撂在这儿的结论 AI 越强，知识浪费越严重。以前一天产出几千字文档，现在和 AI 对话轻松上万字。但这些"对话态"的知识，绝大多数产生之后就蒸发了——窗口一关，就不再看了。记住一切等于什么都没记住。筛选和遗忘，才是记忆的精髓。这是我搭建知识系统过程中悟到的。不是要把所有东西都存下来，而是让系统知道什么该记住、什么该放手。我已经好多年没用过纸质笔记本了。虽然到现在还会忍不住买精美的本子和笔，买完往书架上一放，供着。但真要记东西，我不会去翻那些本子。写在纸上的内容，写完那一刻就开始沉睡了。 BTW，这篇文章基于我自己搭建的一套记忆系统实践，有代码、有踩坑经验，不是纯理论空谈。你的知识，散落在哪里？你的知识现在大概分布在这些地方： Obsidian/Notion/飞书/语雀里的笔记（如果你有坚持写的话）散落各处的项目文件夹（可能叫 project_v2_final_真的最终版）和 AI 的聊天记录（窗口一关，灰飞烟灭）纸质笔记本里面大脑里（众所周知，这个存储介质的可靠性不太行）这些知识之间基本是孤岛状态。上周和 Claude 讨论的细节，这周换个 session 就得从头解释。去年踩过的坑写的复盘，今年遇到类似场景，完全想不起来那份文档存在哪里。这就是我们要解决的问题：Agent 时代，个人知识管理到底该怎么搞？第一章：为什么现在必须重视知识管理知识管理不是新鲜话题。那为什么到了 2025、2026 这个节点，这事又变得有意思起来了？因为 AI Agent 既是知识的消费大户，也是生产大户。以前你写一份技术方案，可能就自己看看、存个档。现在不一样了——你和 Agent 之间一天可能产生上万字的交互。这些对话里藏着你的偏好、决策逻辑、踩过的坑，全是有价值的东西。但 Agent 默认不会帮你留住这些。关掉窗口，一切归零。这就是问题所在：Agent 越强，知识浪费越严重。举个例子：我最近在探索智能知识管理，和大模型讨论了几十上百个 session。每个 session 里都有重要的技术决策：为什么选择 Pinecone 而不是 Milvus、向量维度从 768 调到 1024 的理由、混合检索的权重参数怎么设…… 如果这些东西没有系统性地沉淀下来，三个月后再维护这个系统，我得重新和 AI 解释一遍所有背景。这就是巨大的隐性成本。第二章：传统知识管理的三个死穴在聊怎么做之前，先看看传统方案哪里不行。 2.1 文件夹模式：人能记住，机器搜不到最原始的方式：按项目、按日期建文件夹，文档往里扔。这个方案的最大问题是检索靠记忆。你知道三个月前写过一份PPT，但记不清放在哪个目录的哪个子文件夹里。搜文件名？关键词可能没对上。全文搜索？几万个文件扫一遍，跳出来一堆不相关的结果。更要命的是跨项目复用几乎不可能。A 项目总结的经验教训，B 项目需要时，你压根不知道它存在。 ...

情境：想象你正在和一个聪明的助手合作一个持续数月的项目。每次开启新会话，你都需要重新交代背景：“我们用 Python 开发”、“上次讨论的那套错误处理方案”、“别忘了我的代码风格偏好”。这就是当前大多数 AI 助手的真实处境——它们拥有海量知识，却缺乏对你个人的长期记忆。第一章：NanoClaw 原有的记忆机制——文件即记忆要理解我们为什么要重构记忆系统，必须先看清现状。 NanoClaw 是一款基于容器隔离的 AI 助手框架，它的核心设计哲学是极简与安全：每个工作群组拥有独立的文件系统沙盒，Agent 在完全隔离的容器中运行，通过挂载机制访问受限的资源。在这种架构下，记忆被实现为一种文件中心式的朴素方案： 1.1 CLAUDE.md：人工维护的静态记忆每个群组目录下都有一个 CLAUDE.md 文件，这是 NanoClaw 最初唯一的持久化记忆载体。图1：V1 架构下，记忆完全依赖人工编辑的 Markdown 文件。用户需要手动整理项目背景、编码规范、历史决策，Agent 被动读取。它的工作方式极其直白：系统启动容器时，将 CLAUDE.md 的内容完整注入系统提示词。这意味着：人工维护负担重：用户必须主动整理和更新文件内容无法自动沉淀：对话中产生的新知识、新偏好不会自动被记录全量加载浪费：无论当前任务是否需要，整个文件都会被塞进上下文 1.2 SQLite 消息库：仅存的对话痕迹 NanoClaw 确实记录了所有对话消息，存储在本地 SQLite 数据库中。但查看 src/db.ts 的实现会发现： // 消息仅被原样存储，无任何结构化提取 export function storeMessage(msg: NewMessage): void { const sql = ` INSERT INTO messages (chat_jid, sender_jid, content, timestamp, is_from_me) VALUES (?, ?, ?, ?, ?) `; db.prepare(sql).run( msg.chatJid, msg.senderJid, msg.content, msg.timestamp, msg.isFromMe ? 1 : 0 ); } 这些消息只是流水账式的存档，没有被转化为可检索、可关联的结构化记忆。当 Agent 需要回顾历史时，它面临的是成千上万条未经整理的原始对话，而不是精炼的知识条目。 ...

AI 时代的知识管理：一点个人思考以及小小的探索实验

从文件日记到向量记忆：NanoClaw 记忆系统的工程化重构