llm-wiki wiki · analysis 2026-06-09

这页把当前知识库里 AI Agent framework / coding agent / Agent OS / MCP / skills / memory / runtime 相关材料整理成一张工程地图。核心结论:Agent 生态已经明显分层,不再是“哪个框架能调工具”这么简单。

End-user agents / coding agents
        ↓
Agent framework / workflow runtime
        ↓
Tool protocol / gateway / SDK
        ↓
Skills / memory / context / observability
        ↓
Runtime / sandbox / cloud-native substrate

如果说 agent-memory-project-map 关注“Agent 如何记住”,agent-runtime-sandbox-project-map 关注“Agent 如何安全运行”,这页关注的是“Agent 工程生态如何分层组合”。

分层地图

代表项目 / 页面 解决的问题
End-user agents / coding agents claude-code, OpenClaw, Hermes, OpenCode, OpenClaude, NemoClaw, nanobot 用户直接使用的 Agent、terminal coding agent、个人 assistant
Agent framework / workflow runtime AgentScope, LangGraph, LangChain, Dify, Eino, ADK, Dapr, YoMo 构建 Agent 应用、workflow、状态图、多 Agent 协作
Tool protocol / gateway / SDK mcp, FastMCP, GitHub MCP, Playwright MCP, agentgateway, Claude Agent SDK 工具/资源接入、协议统一、流量治理
Skills / prompt pack Anthropic Skills, agent-skills, code review skills, architecture diagram skills 把能力做成 Markdown + scripts + workflow 的可迁移包
Memory / context / observability / eval agent-memory-project-map, claude-context, Langfuse, AgentOps, OpenJudge 长期记忆、代码语义上下文、trace、cost、eval
Runtime / sandbox / cloud-native agent-runtime-sandbox-project-map, agent-sandbox, agentcube, OpenShell, SkyPilot 隔离、会话编排、K8s、多云算力

横向对比

维度 End-user Agent Framework / Workflow MCP / Gateway Skills Memory / Context Runtime / Sandbox
面向用户 终端用户 / 开发者 应用开发者 平台/工具开发者 Agent 使用者和作者 Agent / 平台 平台/运维
核心对象 Agent session / task Agent / graph / event loop tool/resource/API route skill directory / prompt pack memory item / context chunk sandbox / session / pod
主要接口 CLI / chat / IDE Python/Go SDK / HTTP service MCP / Gateway API / xDS Markdown + scripts search / recall / inject CRD / CLI / SDK
状态模型 会话历史和任务状态 AgentState / workflow state route/session/policy state 文件系统 DB/Markdown/vector index K8s/Gateway/session store
工程难点 体验、恢复、工具安全 可组合、并发、权限、人类确认 鉴权、RBAC、federation、observability 可迁移性、边界、依赖 写入质量、检索、注入预算 隔离、凭据、网络、恢复

生态信号

来自 src-ai-agent-frameworks-stars 的 109 个项目可以归纳出几条趋势:

关键项目剖面

AgentScope:生产 Agent 应用框架

AgentScope 的核心不是固定 DSL,而是事件流:

User Msg
        ↓
Agent.reply_stream()
        ↓
reasoning event / tool call event / confirm event / tool result event
        ↓
AgentState + storage + SSE

它把模型 provider、toolkit、MCP、skills、workspace、权限、人类确认、长任务 offload 和 FastAPI service 拆成可组合层。它适合做生产 Agent app,而不是底层安全 sandbox。

值得借鉴:

nanobot:小内核个人 Agent

nanobot 的价值是“小内核 + 可插拔层”:

它适合研究个人 Agent 如何保持可读、可改、可恢复。与 AgentScope 相比,nanobot 更轻、更端侧、更偏个人运行;AgentScope 更服务化、更面向生产多租户。

HiClaw:Agent 平台化和声明式运维

HiClaw 代表“Agent 是 K8s 资源”的路线。它用 Worker/Team/Human/Manager CRD 表达多 Agent 系统,用 Matrix 作为协作平面,用 Higress 托管真实凭据。

它和 Python framework 的差异很大:

维度 HiClaw 普通 Agent framework
Agent 表达 CRD Python class / graph node
部署单元 容器 / Pod 进程内对象
协作面 Matrix room in-process bus / state graph
人在回路 默认房间成员 需要自建 UI
凭据 网关托管 常见是 Agent 持 key
运维 reconcile / RBAC / Helm 应用自己补

它说明企业级 Agent 平台不会停留在 SDK 层,最终会进入 controller、网关、IM、对象存储和权限系统。

agentgateway:Agent 流量基础设施

agentgateway 说明 Agent 生态需要独立的数据面。它统一 LLM API、MCP tools 和 A2A 通信,复用 Gateway API / xDS / CEL / HBONE 等云原生治理模式。

在 frameworks 地图里,它的位置是 tool/gateway layer:

这和 agent-runtime-sandbox-project-map 里的安全 runtime 形成互补:sandbox 控制 Agent 进程,gateway 控制 Agent 流量。

agent-sandbox / agentcube:Agent 执行基座

framework 能构建 Agent,但安全运行需要 substrate:

这两者说明 Agent framework 生态正在从“库”扩展到“运行时平台”。LangGraph/AgentScope/nanobot 这类框架可以把 sandbox/session layer 作为 backend,而不是自己处理 Pod、PVC、NetworkPolicy、WarmPool。

Memory / context layer:独立产品层

agent-memory-project-map 已经显示:Agent memory 不是框架内部一个 list,而是完整管线。代码语义上下文也类似,claude-context / milvus / hybrid-search-rrf / code-semantic-search 组成独立层。

Agent framework 越轻,越需要外部 memory/context;Agent product 越重,越倾向把 memory/context 内置成用户体验的一部分。

设计轴

1. Library、runtime、product 是三种不同形态

Agent 生态常被混称为“框架”,但至少有三种形态:

三者可以组合,但不要混为一谈。一个库不应该承担全部 sandbox 安全;一个 sandbox 原语也不应该决定 Agent 的 reasoning loop。

2. MCP 是协议层,不是 Agent 框架

mcp 解决 tool/resource 接入,但它不定义:

所以 MCP 更像 TCP/HTTP 之于 Web 应用:它是必要基础,但不是完整应用框架。

3. Skills 正在替代一部分插件代码

Skills 的关键价值是把能力封装成:

description
        ↓
instructions / workflow
        ↓
scripts / assets / templates
        ↓
LLM decides when to invoke

这比硬编码插件更容易迁移到 Claude Code、Codex、OpenCode、OpenClaw 等不同 Agent。缺点是权限、依赖、版本和测试要单独治理。

4. Observability 和 eval 会成为框架边界

Agent 框架如果只返回最终文本,就很难调试。生产 Agent 需要:

AgentScope 的事件流、nanobot 的 checkpoint、Langfuse/AgentOps/OpenJudge 这类项目说明观测和评测会从周边工具变成基础层。

5. Cloud-native runtime 会吞掉“本地 demo”边界

Agent 一旦进入生产,就会需要:

这解释了为什么 agent-sandboxagentcube、OpenShell、HiClaw、SkyPilot 都出现在 Agent frameworks 的生态列表里。它们不是偏题,而是 Agent 工程从 demo 到 production 的必经层。

核心难点

1. Agent loop 和工具权限必须解耦

模型是否要调用工具是一回事,工具是否允许执行是另一回事。AgentScope 把 tool execution 拆成验证/权限/上下文写入与 raw I/O,agentgateway 用 CEL 做工具/流量 RBAC,OpenShell 在 sandbox proxy 做网络裁决。这个边界越清楚,系统越安全。

2. 人类确认要进入状态机

Agent 工作流经常需要审批、外部执行、人工介入。把它做成 blocking input 会破坏服务化。更稳的是 AgentScope continuation event、HiClaw Matrix room、OpenShell policy proposal 这种状态机/协作平面设计。

3. 多 Agent 协作不能只靠 in-process bus

Python 框架里的多 Agent 通常是进程内对象互调。企业场景需要身份、房间、审计、凭据隔离、文件共享和跨进程恢复。HiClaw 用 Matrix + MinIO + Higress + CRD 给出了平台化答案。

4. 跨 Agent 可迁移能力需要文件协议

Skills、memory Markdown、AGENTS.md、MCP server config 都说明:Agent 能力包更适合用文件/目录作为接口,而不是只靠 Python import。文件协议利于审计、迁移、版本控制和 LLM 读取。

5. 上下文层会越来越独立

Agent framework 内置短期 context 不够。代码语义检索、长期记忆、tool result offload、workspace artifacts 都会成为独立层。框架需要定义清楚 context provider 接口,而不是把所有上下文都塞进一个 prompt builder。

6. 产品入口和工程底座经常错位

用户看到的是 Claude Code/OpenClaw/nanobot;工程底座却是 MCP、skills、memory、sandbox、gateway、observability。项目地图的价值就是把这些层分开,避免拿“最终产品”和“底层原语”直接比较。

设计分型

分型 代表 架构重心
Terminal coding agent claude-code, OpenCode, OpenClaw CLI/IDE 入口、tool use、workspace、hooks
Personal always-on agent nanobot, Hermes, OpenClaude channels、long-running loop、memory、scheduler
Agent app framework AgentScope, LangGraph, LangChain, Eino event loop、workflow graph、toolkit、service
Agent platform / OS HiClaw, OpenShell/NemoClaw runtime、identity、policy、collaboration
Tool protocol layer mcp, FastMCP, GitHub MCP, Playwright MCP tool/resource 接入和 schema
Agent gateway layer agentgateway, Plano LLM/MCP/A2A traffic、policy、telemetry
Capability package layer Anthropic Skills, agent-skills Markdown + scripts + reusable workflow
Memory/context layer agent-memory-project-map, claude-context recall、semantic search、context control
Runtime substrate agent-runtime-sandbox-project-map sandbox、session、credential、network

选型建议

目标 优先看 工程关注点
做生产多 Agent 应用框架 AgentScope AgentEvent、tool permission、workspace/offload、FastAPI
做轻量个人 Agent 内核 nanobot channel bus、8 态状态机、provider fallback、skills/context
做企业多 Agent 平台 HiClaw CRD、Matrix、Higress、credential isolation
做 tool/resource 协议层 mcp / FastMCP tool schema、transport、client identity
做 Agent 流量网关 agentgateway Gateway API、CEL RBAC、LLM/MCP/A2A federation
做 coding agent 生态扩展 claude-code 周边 hooks、skills、memory、trace、templates
做运行时安全与会话编排 agent-runtime-sandbox-project-map sandbox、session、policy、provider credentials
做长期记忆和上下文 agent-memory-project-map, claude-context source-of-truth、hybrid search、context injection

当前知识库缺口