llm-wiki wiki · entities 2026-06-12

vLLM 生态的 system-level intelligent router,重点是按请求语义、模型能力、PII/prompt guard 和 mixture-of-models 策略做路由。详见 src-semantic-router-architecture

架构边界

它与 llm-d-router 的差异很关键:semantic-router 偏语义分类和模型选择,llm-d-router 偏 K8s runtime metrics、Endpoint Picker 和 InferencePool。与 routellm 相比,它更工程化/系统化,而 RouteLLM 更像成本/质量路由算法基线。

选型判断