昇腾开源
🏁 开始使用
快速安装昇腾环境
🏗️ 基础设施与框架
Accelerate
DeepSpeed
kernels
PyTorch
Transformers
🧠 训练与微调框架
LLaMA-Factory
NPU安装及配置
NPU训练
分布训练
ms-swift
ROLL
TorchTitan
Transformer Reinforcement Learning
VeOmni
verl
🚀 推理与服务
Llama.cpp
LMDeploy
ONNX Runtime
Sentence Transformers
SGLang
Torchchat
🎨 多模态、应用与评测
Diffusers
LM-Evalution-Harness
open_clip
OpenCompass
OpenCV
Stable-Diffusion-WebUI
timm
WeNet
Whisper.cpp
昇腾开源
LLaMA-Factory
查看页面源码
LLaMA-Factory
NPU安装及配置
核心依赖说明
方式一:手动安装环境
1. 版本及下载链接
2. 驱动及固件
3. CANN
4. torch-npu
5. 验证安装
方式二:Docker 预安装镜像
1. 拉取镜像
2. 启动容器
3. 进入容器
方式三:Docker 本地构建
1. 使用 Docker Build 构建
2. 使用 Docker Compose 构建
NPU训练
支持设备
支持功能
快速开始
分布式训练
关键环境变量
单机训练
多机训练
训练方式
预训练 (PT)
监督微调 (SFT)
奖励模型 (RM)
DPO 训练
全参数微调 (Full)
性能优化
融合算子
算子下发优化
分布训练
NativeDDP
单机多卡
多机多卡
DeepSpeed
单机多卡
多机多卡
DeepSpeed 配置文件
FSDP
单机多卡
多机多卡
FSDP2
Ray
单机多卡
多机多卡