Envoy AI Gateway 架构与设计思路分析
envoyproxy/ai-gateway 是 Envoy Gateway 生态的 GenAI gateway。源码包含 CRD API、controller、extproc、provider translators、backend auth、body/header mutator、rate limit、redaction、MCP proxy、metrics/tracing 和大量 data-plane/e2e tests。它解决的是 LLM/API 访问治理,不是模型 serving engine。
核心架构图
┌──────────────────────────── user / API surface ──────────────────────────────┐
│ `envoyproxy/ai-gateway` 是 Envoy Gateway 生态的 GenAI gateway。源码包含 CRD API、c… │
└───────────────────────────────┬───────────────────────────────────────────────┘
│
┌───────────────────────────────▼───────────────────────────────────────────────┐
│ core implementation: `api/v1alpha1`, `api/v1beta1` · `cmd/controller`, `internal/controller` │
└───────────────┬───────────────────────────────┬───────────────────────────────┘
│ │
┌───────────────▼──────────────┐ ┌─────────────▼──────────────────────────────┐
│ `cmd/extproc`, `internal/extproc` │ │ `internal/translator` │
└───────────────┬──────────────┘ └─────────────┬──────────────────────────────┘
│ │
┌───────────────▼───────────────────────────────▼──────────────────────────────┐
│ selected value: routing / serving / dashboard / graph layer for current wiki │
└───────────────────────────────────────────────────────────────────────────────┘
模块分层
| 层/目录 | 责任 |
|---|---|
api/v1alpha1, api/v1beta1 |
AI Gateway CRD。 |
cmd/controller, internal/controller |
控制面。 |
cmd/extproc, internal/extproc |
Envoy External Processing 数据面。 |
internal/translator |
OpenAI/Bedrock 等 provider 翻译。 |
关键数据流
- Gateway/HTTPRoute 流量进入 Envoy。
- extproc 根据 AI Gateway 配置改写/校验/路由请求。
- translator 处理不同 provider 协议差异,auth/ratelimit/redaction 处理治理。
设计决策
- 建立在 Envoy Gateway 上,复用成熟 L7 控制面。
- 把 provider protocol translation 当核心能力,最近 Bedrock translator 修复就是例子。
- MCP proxy 表明它不只管 LLM,也在扩展到 tool gateway。
对比定位
和 agentgateway 相比,Envoy AI Gateway 更 Envoy Gateway/CRD-first;和 Higress/kgateway 相比,它更专注 GenAI,而不是通用 API gateway。
相关链接
- GitHub 当前状态底稿:src-github-stars-backlog-current-state
- 选型地图:github-stars-backlog-implementation-map