vLLM

需代理

高吞吐开源大模型推理与服务引擎。

国外 免费 开源
访问官网

可访问性人工复核 · 定期更新

核心功能点

  • 开源
  • 高吞吐
  • PagedAttention
  • OpenAI 兼容

适用场景

模型部署、推理服务、高并发

同类替代