AgentMemory 完全指南:AI 编码 Agent 的持久记忆引擎

📖 目录

为什么 AI 编码 Agent 需要持久记忆

用过 Claude Code、Cursor 或 Codex CLI 的开发者都有过这个体验——每个新会话,Agent 就像失忆了一样

  • 上回刚定好的架构决策又要重新解释
  • 之前发现的 bug 又走一遍同样的排查路径
  • 项目偏好的代码风格、测试框架、工具链每次都要重复设定

传统的解决方案无非两种:要么往 CLAUDE.md 里塞大量上下文(很快就满了),要么每次手动粘贴——两个都不靠谱

AI 编码 Agent 真正缺少的,是一个能自动积累、高效检索的长期记忆系统

AgentMemory 是什么

AgentMemory 是一个开源的持久记忆引擎,专为 AI 编码 Agent 设计。它本质上是一个 MCP 记忆服务器,运行在后台,默默地记录 Agent 每次会话的关键信息,下次会话时自动把最相关的上下文注入回来

核心团队基于 iii-engine 构建,采用 SQLite 本地存储,零外部数据库依赖

核心特性

  • 12 个自动捕获钩子——零手动操作,Agent 每做一件事都自动记忆
  • 混合检索——BM25 关键词 + Vector 语义 + Knowledge Graph 三路融合排序
  • 4 级记忆生命周期——从短期缓存到长期巩固,自动衰减和遗忘
  • 跨 Agent 共享——Claude Code、Cursor、Codex CLI、Gemini CLI 共享同一个记忆服务器
  • 实时可视化——本地 3113 端口提供记忆浏览器
  • 零外部依赖——SQLite + iii-engine 就够了

基准测试:检索准确率 95.2%

在 ICLR 2025 的 LongMemEval-S 基准(500 道题)上,AgentMemory 的检索准确率表现亮眼

系统 R@5 R@10 MRR
AgentMemory 95.2% 98.6% 88.2%
BM25 纯关键词 86.2% 94.6% 71.5%

预算对比更直观——传统做法是把全部上下文塞进 prompt,一年下来 token 消耗 19.5M+,直接超过窗口上限。AgentMemory 每年的 token 成本控制在约 170K(约 10 美元),如果本地跑 embedding 甚至零成本

方案 年消耗 Token 年成本
全量上下文 19.5M+ 超出窗口上限
LLM 摘要压缩 ~650K ~500 美元
AgentMemory ~170K ~10 美元
AgentMemory + 本地 embedding ~170K 0 美元

快速开始:一键启动

启动记忆服务器只需要一条命令

# 启动 AgentMemory 服务器(默认端口 3113)
npx @agentmemory/agentmemory

启动后可以在另一个终端跑 demo 看看效果

# 种子 demo 数据并测试语义检索
npx @agentmemory/agentmemory demo

Demo 会写入 3 个真实的开发会话(JWT 鉴权实现、N+1 查询优化、限流中间件),然后演示语义检索效果——搜 "database performance optimization" 能找回 "N+1 query fix"

打开浏览器访问 http://localhost:3113,可以看到记忆库的实时可视化界面

💡 提示 每条记忆都支持回放功能——在 Viewer 的 Replay 标签页里可以回溯 Agent 当时的 prompt、工具调用、结果和执行时间线,支持 0.5x-4x 倍速播放

接入各种 AI 编码 Agent

AgentMemory 通过 MCP 协议与主流 AI 编码 Agent 互通,以下是各 Agent 的接入方式

Claude Code

完整支持 12 个捕获钩子,是最深度的集成——Agent 的每一步操作都会被自动记录

# 在 Claude Code 中启用 AgentMemory MCP
claude mcp add agentmemory -- npx @agentmemory/agentmemory mcp

Cursor

通过 MCP 服务器接入

# Cursor 设置 → MCP Servers 中添加
npx @agentmemory/agentmemory mcp

Codex CLI (OpenAI)

同样通过 MCP 协议

codex mcp add agentmemory
  -- npx @agentmemory/agentmemory mcp

Gemini CLI

gemini-cli mcp add agentmemory
  -- npx @agentmemory/agentmemory mcp

还可以接入 OpenCode、Cline、Goose、Kilo Code、Aider、Windsurf、Roo Code 等——只要支持 MCP 或 REST API 的 Agent 都可以

实战工作流

用一个真实的开发场景来说明 AgentMemory 如何改变工作流

场景:开发 JWT 认证模块

第一天:你让 Claude Code 实现 JWT 认证

  • Claude 创建了 src/middleware/auth.ts,用了 jose 库而非 jsonwebtoken(因为要兼容 Edge Runtime)
  • 写了完整的测试覆盖 token 签发、验证、过期处理
  • AgentMemory 自动捕获了这个会话的所有决策

第二天:你让同一个 Agent 添加限流中间件

  • Agent 自动检索到昨天的上下文——知道项目用了 jose、测试结构、Edge 兼容需求
  • 新写的限流中间件直接采用了同样的错误处理模式
  • 不需要手动解释任何背景

一周后:你让 Cursor 修复一个认证相关的 bug

  • AgentMemory 的共享记忆让 Cursor 也知道了整个项目的架构决策
  • Bug 修复自动遵循了既定的代码风格和测试约定
🔑 关键点 AgentMemory 的跨 Agent 共享记忆意味着你用 Claude Code 定下的架构决策,Cursor 和 Codex CLI 也都能感知到——团队里的不同 Agent 不再各自为战

竞品对比

市面上的 Agent 记忆方案并不少,但 AgentMemory 有一些明显的差异化优势

维度 AgentMemory mem0 (53K ⭐) Letta/MemGPT (22K ⭐) CLAUDE.md 内置
类型 记忆引擎 + MCP 服务器 记忆层 API 完整 Agent 运行时 静态文件
检索 R@5 95.2% 68.5% 83.2% N/A
自动捕获 12 个钩子(零手动) 手动调用 add() Agent 自编辑 手动编辑
搜索方式 BM25 + Vector + Graph + RRF 融合 Vector + Graph Vector(归档) 全部加载到上下文
跨 Agent ✅ MCP + REST + leases ❌ 仅 API ❌ 仅 Letta 运行时 ❌ 每个 Agent 独立文件
外部依赖 无(SQLite + iii-engine) Qdrant / pgvector Postgres + Vector DB
记忆生命周期 4 级巩固 + 衰减 + 自动遗忘 被动提取 Agent 管理 手动清理
自托管 ✅ 默认 可选 可选

进阶配置

1. 导入已有会话

如果之前用 Claude Code 积累了大量 JSONL 会话记录,可以一键导入

# 导入所有 Claude Code 会话
npx @agentmemory/agentmemory import-jsonl

# 或导入单个文件
npx @agentmemory/agentmemory import-jsonl ~/.claude/projects/my-project/abc123.jsonl

2. 本地 Embedding

默认使用 all-MiniLM-L6-v2 模型做本地 embedding,无需 API key 也没有网络请求

# 配置本地 embedding 模型
AGENTMEMORY_EMBEDDING_MODEL=all-MiniLM-L6-v2 \
  npx @agentmemory/agentmemory

3. 文件系统监听

v0.9.0 新增的 @agentmemory/fs-watcher 模块可以监听文件变化自动生成记忆,比如你改了一个配置文件,AgentMemory 自动记录

npx @agentmemory/fs-watcher --watch ./src

4. 升级维护

npx @agentmemory/agentmemory upgrade

⚠️ 注意:这个命令会更新 JavaScript 依赖并可能运行 cargo install 更新 iii-engine

5. OpenClaw 集成

AgentMemory 已经内置了 OpenClaw 插件支持

# OpenClaw 配置中启用 AgentMemory
openclaw config set agentmemory.enabled true

总结

AgentMemory 解决的是 AI 编码 Agent 生态中一个一直被忽视的核心问题——长期记忆的缺失

它的设计理念很简单:让上下文自动积累而不是每次都从零开始。通过 MCP 协议实现跨 Agent 共享记忆,通过混合检索实现精准召回,通过本地 SQLite 实现零依赖部署

对于重度使用 AI 编码 Agent 的开发者来说,这可能是 2026 年最值得装上的工具——省掉的不只是重复解释的时间,更重要的是 Agent 能真正"了解"你的项目

🚀 快速链接
GitHub: github.com/rohitg00/agentmemory
官网: agent-memory.dev
NPM: @agentmemory/agentmemory
一键启动: npx @agentmemory/agentmemory