NPU 型号 | FP16 算力 | 显存 | 对应华为整机 | 芯片代工厂 |
---|---|---|---|---|
昇腾 Ascend 910B4 | 280T | 32GB HBM2 | Atlas 800I A2 | 中芯国际 |
昇腾 Ascend 910B3 | 313T | 64GB HBM2 | Atlas 800T A2 | 中芯国际 |
昇腾 Ascend 910B2 | 376T | 64GB HBM2 | 台积电 | |
昇腾 Ascend 910B1 | 414T | 64GB HBM2 | 台积电 |
由于没有 fp8 计算单元,若要部署完整精度的 Deepseek R1,则需要将近 2T 显存,需要至少 4 台 8 卡 64GB 版本的 910B
Photo by A Chosen Soul on Unsplash