直到八月中旬
我相信大家都是对的
今年GTC21发布
NVIDIA A30 GPU
不再陌生
A30架构接近A100,峰值原生FP32性能似乎并不突出,但双精度浮点FP64 5.2 TFlops是单精度的一半,并且拥有出色的Tensor Core加速计算性能,同时功耗降低至165W。
A30拥有24GB HBM2内存,带宽依然高达933GB/s,还提供PCIe Gen4和NVLink 200GB/s互连接口。
通过MIG(多实例GPU)硬件切片,A30 可以选择性地分割为4 个6GB、2 个12GB 或1 个24GB 实例。
至于媒体加速引擎,A30配备了4个视频解码器(NVDEC)、1个JPEG解码器和光流加速器(OFA,光流加速器)。
与上述官方参数对比
相信大家都会比较关心
模型训练期间的NVIDIA A30
实际表现
超集信息联邦Insightface
基于NVIDIA A30
进行IResNet网络训练数据
测试服务器参数
性能测试数据
通过IResNet网络不同精度、不同深度的训练结果数据,提出以下建议:
1. 在IResNet-50网络中,通过FP16+TF32混合精度训练,Samples/sec可以达到2640,高于FP16的2520和TF32的2250。建议大家在使用A30进行深度神经网络时优先考虑混合精度网络培训。
用户评论
真香!看了这篇 NVIDIA A30 实测数据报告,对它的性能有了更清晰的认识。
有8位网友表示赞同!
训练效率提升真的明显啊!这篇文章给的数据很有说服力。
有15位网友表示赞同!
想要知道A30到底怎么做到的,这份报告解读得很棒!
有20位网友表示赞同!
作为一名AI从业者,这篇 NVIDIA A30实测数据报告简直是干货满满!
有16位网友表示赞同!
终于找到了详细的性能对比数据,太感谢作者了!
有16位网友表示赞同!
NVIDIA A30训练优化真的值得一试!
有9位网友表示赞同!
A30的数据处理能力确实出色!这篇报告可以作为选购参考。
有12位网友表示赞同!
学习新的深度学习技术,这份实测报告非常有用!
有20位网友表示赞同!
性能提升超乎想象!我迫不及待想亲自试试 A30!
有15位网友表示赞同!
干货满满!强烈推荐给所有研究AI训练优化的人!
有17位网友表示赞同!
看完这篇报告,我决定入手A30了!
有13位网友表示赞同!
数据清晰直观,分析到位,真专业!
有11位网友表示赞同!
这份报告彻底解决了我的疑问。感谢作者的分享!
有13位网友表示赞同!
NVIDIA A30实测:训练速度快、效率高。
有7位网友表示赞同!
A30在训练优化方面的表现令人印象深刻!
有6位网友表示赞同!
这篇文章让我对 NVIDIA A30 有更深入的了解!感谢详细的介绍!
有17位网友表示赞同!
NVIDIA A30实力强悍,绝对是训练优化的好选择!
有7位网友表示赞同!
想要提升训练效率?看这篇报告就够了!
有17位网友表示赞同!
A30:训练速度快、性价比高!
有6位网友表示赞同!