NVIDIA|NVIDIA发布新一代H100 GPU核心:4nm工艺、1.8万核心、700W功耗
黄仁勋终于公布了NVIDIA新一代架构与核心 , 当然这次是面向HPC高性能计算、AI人工智能的“Hopper” , 对应核心编号“GH100” , 同时发布的还有基于新核心的加速计算卡“H100”、AI计算系统“DGX H100” 。
与传闻不同 , GH100核心采用的其实是台积电目前最先进的4nm工艺 , 而且是定制版 , CoWoS 2.5D晶圆级封装 , 单芯片设计 , 集成多达800亿个晶体管 , 号称世界上最先进的芯片 。
完整版有8组GPC(图形处理器集群)、72组TPC(纹理处理器集群)、144组SM(流式多处理器单元) , 而每组SM有128个FP32 CUDA核心 , 总计18432个 。
显存支持六颗HBM3或者HBM2e , 控制器是12组512-bit , 总计位宽6144-bit 。
Tensor张量核心来到第四代 , 共有576个 , 另有60MB二级缓存 。
扩展互连支持PCIe 5.0、NVLink第四代 , 后者带宽提升至900GB/s , 七倍于PCIe 5.0 , 相比A100也多了一半 。整卡对外总带宽4.9TB/s 。
性能方面 , FP64/FP32 60TFlops(每秒60万亿次) , FP16 2000TFlops(每秒2000万亿次) , TF32 1000TFlops(每秒1000万亿次) , 都三倍于A100 , FP8 4000TFlops(每秒4000万亿次) , 六倍于A100 。
文章图片
文章图片
文章图片
H100计算卡采用SXM、PCIe 5.0两种形态 , 其中后者功耗高达史无前例的700W , 相比A100多了整整300W 。
按惯例也不是满血 , GPC虽然还是8组 , 但是SXM5版本只开启了62组TPC(魅族GPC屏蔽一组TPC)、128组SM , 总计有15872个CUDA核心、528个Tensor核心、50MB二级缓存 。
PCIe 5.0版本更是只有57组TPC , SM虽然还是128组 , 但是CUDA核心只有14952个 , Tensor核心只有456个 。
文章图片
DGX H100系统集成八颗H100芯片、搭配两颗PCIe 5.0 CPU处理器(Intel Sapphire Rapids四代可扩展至器?) , 拥有总计6400亿个晶体管、640GB HBM3显存、24TB/s显存带宽 。
性能方面 , AI算力32PFlops(每秒3.2亿亿次) , 浮点算力FP64 480TFlops(每秒480万亿次) , FP16 1.6PFlops(每秒1.6千万亿次) , FP8 3.2PFlops(每秒3.2千亿次) , 分别是上代DGX A100的3倍、3倍、6倍 , 而且新增支持网络内计算 , 性能3.6TFlops 。
PCIe 5.0版本的性能基本都再下降20% 。
同时配备Connect TX-7网络互连芯片 , 台积电7nm工艺 , 800亿个晶体管 , 400G GPUDirect吞吐量 , 400G加密加速 , 4.05亿/秒信息率 。
文章图片
文章图片
文章图片
DGX H100是最小的计算单元 , 为了扩展 , 这一次NVIDIA还设计了全新的VNLink Swtich互连系统 , 可以连接最多32个节点 , 也就是256颗H100芯片 , 称之为“DGX POD” 。
这么一套系统内 , 还有20.5TB HBM3内存 , 总带宽768TB/s , AI性能高达颠覆性的1EFlops(100亿亿亿次每秒) , 实现百亿亿次计算 。
系统合作伙伴包括Atos、思科、戴尔、富士通、技嘉、新华三、慧与、浪潮、联想、宁畅、超威 。
云服务合作伙伴包括阿里云、亚马逊云、百度云、Google云、微软Azure、甲骨文云、腾讯云 。
文章图片
推荐阅读
- ARM|NVIDIA发布Grace CPU处理器:144核+500W功耗 性能无敌手
- 索尼|仅353克!索尼G镜头FE PZ 16-35mm F4 G发布:8499元
- 电子书|1799元!海信Hi Reader阅读器发布:紫光展锐T610加持
- 蓝牙耳机|realme首款旗舰降噪耳机Buds Air3发布:首发349元 比肩1999
- 世嘉|微软Xbox Series S《刺猬索尼克2》限定版发布:手柄全是刺猬毛
- 任天堂|5年来最大升级!Switch发布14.0.0更新:游戏分组终于来了
- AMD|AMD发布6nm MI210计算卡:64GB HBM2e显存、300W功耗
- AMD|NVIDIA、AMD显卡价格全体暴跌!不过还是贵的离谱
- 小米|利润大涨70% 小米发布2021全年财报:手机出货量突破1.9亿台
- NVIDIA|1.8万核心核弹!NVIDIA第一款5nm GPU H100真身首曝
