llm-wiki wiki · sources 2026-06-12

kubeai-project/kubeai 是 K8s AI inference operator,定位比 KServe 更轻:Model CRD、OpenAI-compatible server、model proxy、autoscaler、model loader、vLLM client、Helm charts 和内置模型 manifests。

核心架构图

┌──────────────────────────── user / API surface ──────────────────────────────┐
│ `kubeai-project/kubeai` 是 K8s AI inference operator,定位比 KServe 更轻:Model … │
└───────────────────────────────┬───────────────────────────────────────────────┘
                                │
┌───────────────────────────────▼───────────────────────────────────────────────┐
│ core implementation: `api/k8s`, `api/openai` · `internal/modelcontroller`, `modelautoscaler`                                    │
└───────────────┬───────────────────────────────┬───────────────────────────────┘
                │                               │
┌───────────────▼──────────────┐  ┌─────────────▼──────────────────────────────┐
│ `internal/openaiserver`, `modelproxy`                     │  │ `components/model-loader`   │
└───────────────┬──────────────┘  └─────────────┬──────────────────────────────┘
                │                               │
┌───────────────▼───────────────────────────────▼──────────────────────────────┐
│ selected value: routing / serving / dashboard / graph layer for current wiki  │
└───────────────────────────────────────────────────────────────────────────────┘

模块分层

层/目录 责任
api/k8s, api/openai K8s API 和 OpenAI API 类型。
internal/modelcontroller, modelautoscaler Model controller 和扩缩容。
internal/openaiserver, modelproxy OpenAI-compatible endpoint 和代理。
components/model-loader 模型加载组件。

关键数据流

  1. 用户创建 Model CRD 或安装 charts/models。
  2. controller 创建 pod/deployment 并注入 model labels。
  3. OpenAI server/model proxy 统一暴露 endpoint。

设计决策

对比定位

和 KServe 相比更轻;和 GPUStack 相比更 Kubernetes operator;和 OME 相比路线更直接。

相关链接