llm-wiki wiki · entities 2026-06-12

Kubernetes 异构 GPU sharing / vGPU 项目,通过 mutating webhook、scheduler extender、device plugin 和多厂商设备后端实现 GPU memory/core/count 等细粒度共享。详见 src-hami-architecture

架构边界

HAMi 不是官方基础 device plugin,也不是 GPU 软件栈 operator。它把调度、quota、annotation、device plugin 和隔离机制结合起来,解决“一个物理 GPU 如何被多个 workload 细粒度共享”。

选型判断