llm-wiki wiki · sources 2026-06-12

kserve/kserve 是 Kubernetes 标准化 model serving 平台。仓库超过 200MB,本次缩小到 cmd/manager/llmisvc/router/localmodelpkg/apis/controller/webhook、charts/config/docs。新近 commit 修复 LLMISvc HTTPRoute parent status 过滤,说明 Gateway API/LLM service 路线正在快速演进。

核心架构图

┌──────────────────────────── user / API surface ──────────────────────────────┐
│ `kserve/kserve` 是 Kubernetes 标准化 model serving 平台。仓库超过 200MB,本次缩小到 `cmd/… │
└───────────────────────────────┬───────────────────────────────────────────────┘
                                │
┌───────────────────────────────▼───────────────────────────────────────────────┐
│ core implementation: `cmd/manager`, `pkg/controller` · `cmd/llmisvc`, `config/llmisvc`                                    │
└───────────────┬───────────────────────────────┬───────────────────────────────┘
                │                               │
┌───────────────▼──────────────┐  ┌─────────────▼──────────────────────────────┐
│ `cmd/localmodel`, `config/localmodels`                     │  │ `pkg/apis`, `pkg/webhook`   │
└───────────────┬──────────────┘  └─────────────┬──────────────────────────────┘
                │                               │
┌───────────────▼───────────────────────────────▼──────────────────────────────┐
│ selected value: routing / serving / dashboard / graph layer for current wiki  │
└───────────────────────────────────────────────────────────────────────────────┘

模块分层

层/目录 责任
cmd/manager, pkg/controller 核心 controller manager。
cmd/llmisvc, config/llmisvc LLM InferenceService 相关控制面。
cmd/localmodel, config/localmodels 本地模型缓存/分发。
pkg/apis, pkg/webhook API 和 webhook。

关键数据流

  1. 用户创建 InferenceService/LLMISvc/LocalModel 资源。
  2. controllers 创建 predictor/router/storage runtime 和 Gateway/HTTPRoute。
  3. status/webhook 维护可用性和校验。

设计决策

对比定位

和 OME/KubeAI 相比,KServe 更成熟和标准;和 llm-d/AIBrix 相比,它是 serving platform 基座,不专门做 SOTA routing/KV 优化。

相关链接