RouteLLM · llm-wiki

RouteLLM 是成本/质量 LLM routing 的算法与评测基线项目，围绕 Python routers、evals 和 benchmarks 比较不同模型路由策略。详见 src-routellm-architecture。

架构边界

它更像路由算法参考和评测框架，不是生产级 Kubernetes gateway，也不是 model serving operator。与 semantic-router 相比，RouteLLM 偏成本/质量决策基线，semantic-router 偏系统级 router / dashboard / operator。

选型判断

适合快速理解 LLM routing 的质量-成本权衡、离线评测和基线实现。不适合直接承担 K8s endpoint picking 或多后端生产流量治理。

架构边界

选型判断

相关页面