英伟达发布基于Ampere架构的A10/A30 Tensor Core GPU

在今日的活动上,英伟达发布了与 CPU 和 GPU 相关的诸多公告,其中就包括了面向数据中心市场、主打虚拟化平台、且基于 Ampere 架构的 A10 / A30 Tensor Core GPU 。两款产品分别基于 GA102 / GA100 GPU 核心,辅以 24GB 的 GDDR6 / HBM2 显存。

访问购买页面:

京东NVIDIA系列商品汇总

3.png

首先介绍下 Nvidia A10 Tensor Core GPU,其基于 GA102-890 SKU,拥有 72 组 SM 单元 / 9216 个 CUDA 核心。

基础频率 855 MHz / 加速可达 1695 MHz,辅以 384-bit @ 24GB GDDR6 显存(频率 12.5 Gbps)、带宽 600 GB/s,并且兼容 PCIe 4.0 。

计算卡本体采用了单槽全长尺寸,辅以被动式散热设计的香槟金色外壳(无风扇),热设计功耗(TDP)150W,通过单 8-pin 外接供电。

性能方面,该卡最高可达 31.2 TF FP32、62.5 TF TF32、125 TF BFLOAT16、250 TOPS INT8、500 TOPS INT4、以及两倍的稀疏性(sparsity)。

2.png

其次是 Nvidia A30 Tensor Core GPU,其基于 GA100 SKU(尚不清楚确切的衍生版本)。

基础频率 930 MHz / 加速可达 1440 MHz,辅以 24GB HBM2 显存(3072-bit @ 1215 MHz),带宽高达 933 GB/s 。

与 A10 不同的是,A30 采用了双槽全长设计,TDP 高达 165W,但仍可通过单 8-pin 外接供电。

性能方面,该卡最高可达 5.2 TF FP64、10.3 TF Peak FP64TF、10.3 TF FP32、82 TF TF32、165 TF BFLOAT16、330 TOPS INT8、661 TOPS INT4、以及两倍的稀疏性。

4.jpg

合作伙伴之一的浪潮,亦推出了 NF5468M6 / NF5468A5 / NF5280M6 三条服务器产品线。

其中 NF5468M6 主打超灵活的 AI 工作负载,支持双路英特尔第三代至强可扩展处理器,8 张英伟达 A100 / A40 / A30 GPU、16 张 A10 GPU、或 20 张 T4 GPU 。

在 4U 机箱中,最多可配备 12 块 3.5 英寸硬盘驱动器,可灵活适应最新的 AI 加速器 / 智能 NIC,辅以一键式切换拓补等功能,适用于 AI 云、智能视频分析(IVA)、视频处理等各种人工智能应用程序。

NF5468A5 多功能 AI 服务器,其支持双路 AMD Rome / Milan CPU 和 8 张英伟达 A100 / A40 / A30 GPU,辅以 N + N 冗余设计。

在全速运行时可调用 8 块 350W 的 AI 加速卡,能够带来出色的性能与可靠性。此外 CPU 与 GPU 之间的非阻塞设计,允许它在不经由 PCIe 交换芯片的情况下实现互连通信,以实现更快的计算效率。

NF5280M6 则是专为所有场景而打造的 2U 产品,支持双路英特尔第三代至强可扩展处理器,4 张英伟达 A100 / A40 / A30 / A10 GPU 或 8 张 T4 Tensor Core GPU,可在 45℃ 下长期稳定运行。

该计算卡配备了最新的 PFR / SGX 技术和可信赖的安全模块设计,适用于要求苛刻的各种 AI 应用。

1.jpg

浪潮还宣布了全新的 M6 AI 服务器,将英伟达 Bluefield-2 DPU 完全集成到了该公司的下一代 AI 服务器中。

可为人工智能、大数据分析、云计算等场景,提供更快、更高效的用户 / 集群管理,以及互连数据的访问 / 虚拟化。

目前全球制造商已经提供了 20 多套经过英伟达认证的系统,预计各大制造商配备 A30 / A10 GPU 的新产品将于今年晚些时候上市。

最后,Nvidia AI Enterprise 采用了永久授权模式,单路 CPU 插槽的报价为 3595 美元,此外企业标准业务支持的年费为 899 美元。

感兴趣的客户,亦可在计划升级到 VMware vSphere 7 Update 2 的时候,申请 NVIDIA AI Enterprise 的早期访问。

您可能还会对下面的文章感兴趣: