🏁 开始使用
🏗️ 基础设施与框架
🧠 训练与微调框架
🚀 推理与服务
⚙️ 算子开发与编程
🎨 多模态、应用与评测
示例
简要说明
01_vector_add_example
简单加法示例
02_fused_softmax_example
Softmax 融合算子示例
03_layer_norm_example
Layer Normalization 示例
04_fused_attention_example
Flash Attention v2 融合注意力算法示例
05_matrix_multiplication_example
矩阵乘法高效实现示例
06_autotune_example
使用 Autotune 进行内核自动调优示例
07_accuracy_comparison_example
精度比对示例