Agent 长期记忆

让 AI Agent 跨会话保留上下文的设计领域。核心矛盾：LLM 上下文窗口有限 + 对话历史天然噪声大 + 用户期望"上次说过的事这次还记得"。

基础形态对比

方案	存储	检索	缺点
全量对话历史	原始 message 数组	按时间截取	噪声大、token 浪费、超窗即丢
摘要压缩	LLM 生成的会话摘要	加载完整摘要	摘要损失细节、跨会话不易关联
结构化观察 + 双索引	facts / concepts / files 等可索引字段 + 向量	三层搜索协议	实现成本高，但精度和 token 效率最好

claude-mem 采用第三种。

claude-mem 用 session_id 双轨制：

必须分两个 ID 才能跨 session 累积同一项工作的上下文。

LLM 的真正用途不是"问答"而是"信息浓缩"。详见 ai-as-compressor。

给 Agent 注册一个"查记忆"工具（如 mem-search Skill），提示词写清触发时机（"用户提到过去/上次时调用"），模型自己学会触发。比手动每次塞历史更优雅。

敏感数据零信任处理——<private>...</private> 标签在 hook 层（边缘）就剥离，永不进入压缩管道。代码在 src/utils/tag-stripping.ts。