NVIDIA最新一代GPU Hopper推出堆不动料了

发布时间：2022-04-09 20:23:28 所属栏目：动态来源：互联网

导读：Nvidia不久前发布了下一代GPU架构，架构名字为Hopper（为了纪念计算机科学领域的先驱之一Grace Hopper）。根据Nvidia发布的具体GPU规格，我们认为Nvidia对于Hopper的主要定位是进一步加强对于人工智能方面的算力，而其算力升级依靠的不仅仅是硬件部分，还

Nvidia不久前发布了下一代GPU架构，架构名字为“Hopper”（为了纪念计算机科学领域的先驱之一Grace Hopper）。

  根据Nvidia发布的具体GPU规格，我们认为Nvidia对于Hopper的主要定位是进一步加强对于人工智能方面的算力，而其算力升级依靠的不仅仅是硬件部分，还有不少算法和软件协同设计部分，本文将为读者做详细分析。

  我们认为，在Nvidia更下一代的GPU中，我们有望看到芯粒技术成为新的亮点来突破其瓶颈。

  在人工智能等高性能计算中，存储（包括DRAM接口带宽和片上存储容量）和计算单元一样重要，在很多时候存储甚至会成为整体性能的瓶颈，例如峰值算力无法持续，导致平均计算能力远低于峰值算力。

在Hopper架构中，我们看到了峰值算力提升大约是Ampere的三倍，然而在DRAM带宽和片上存储方面，Hopper相对于Ampere的提升较小，只有1.5倍和1.25倍。

在DRAM带宽方面，我们看到H100有两个版本，其中使用最新一代HBM3的版本的内存带宽是3TB/s，相比于A100（2TB/s）的提升为1.5倍，相比峰值算力的三倍提升相对较小。

反观A100相对更上一代V100的内存带宽提升为2.2倍，因此我们认为H100的HBM3内存带宽提升幅度确实相对上一代来说较小。我们认为，HBM3带宽提升较小可能和功耗有关。

仔细分析Hopper发布的GPU，我们发现Hopper架构的GPU目前有两个品类，一个是使用HBM3内存的版本，而另一个是仍然使用HBM2e的版本。

HBM3版本的H100相对于使用HBM2e版本的H100在其他芯片架构上（包括计算单元）的差距不过10%（HBM3版本的计算单元较多），但是在功耗（TDP）上面，HBM3版本的H100的TDP比HBM2e版本H100整整高出两倍（700W vs. 350W）。即使是相对于上一代使用7nm的Ampere架构，其功耗也提高了近两倍，因此能效比方面提升并不多，或者说即使更先进的芯片工艺也没法解决HBM3的功耗问题。

因此，我们认为H100 HBM3版本DRAM内存带宽增加可能是受限于整体功耗。而当DRAM带宽提升较小时，如何确保DRAM带宽不成为性能瓶颈就是一个重要的问题，因此Nvidia会提出FP4和Transformer Engine等算法-硬件协同设计的解决方案，来确保在执行下游任务的时候仍然效率不会受限。

（编辑：大连站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

pdf怎么转换成doc 迅速	网站建设安全隐患有哪
谷歌地图正在被抛弃	Google搜索将下降非原

NVIDIA最新一代GPU Hopper推出 堆不动料了

NVIDIA最新一代GPU Hopper推出堆不动料了