DeepSeek-R2发布在即!爆料称参数量较R1翻倍 华为昇腾芯片利用率达82%
日期:2025-04-28 08:35 点击数:85

在硬件平台方面,DeepSeek-R2实现了基于华为昇腾910B(Ascend 910B)芯片集群平台的训练方案,在FP16精度下实现了512 PetaFLOPS的计算性能,芯片资源利用率达到82%。根据华为实验室的数据,这一算力大约是英伟达上一代A100训练集群的91%。可能得益于华为昇腾910B训练集群,DeepSeek-R2的单位推理成本较之GPT-4下降了97.4%,DeepSeek-R2的成本约为0.07美元/百万token,而GPT-4则高达0.27美元/百万token。(ZAKER资讯)
