vLLM-Ascend

vllm-ascend

面向昇腾 NPU 的 vLLM 社区插件 · 高性能 LLM 推理加速

🚀 快速开始

✨ 核心特性

🔌 硬件插件化架构 ⚡ 高性能推理加速 🧩 丰富模型支持 🌐 分布式推理 🔧 完整工具链 🤝 社区共建