首页 > 西陆频道 > 正文

华为AI训练集群 AI算力领先

  散热系统

  传统数据中心多以风冷技术对设备进行散热,但在人工智能时代传统数据中心却面临非常大的挑战。高功耗器件比如CPU和AI芯片带来更大的热岛效应要求更高效的冷却方式。液冷技术可以满足数据中心高功率、高密部署、低PUE的超高需求。

  Atlas 900 AI训练集群采用全液冷方案,创新性设计业界最强柜级密闭绝热技术,支撑>95%液冷占比。单机柜支持高达50kW超高散热功耗,实现PUE<1。1的极致数据中心能源效率。

  另外,在空间节省方面,与8kW风冷机柜相比,节省机房空间79%。极致的液冷散热技术满足了高功率、高密设备部署、低PUE的需求,极大地降低了客户的TCO。

  据了解,华为已在华为云上部署了一个Atlas 900 AI训练集群,集群规模为1024颗昇腾910 AI处理器。基于当前最典型的“ResNet-50 v1。5模型”和“ImageNet-1k数据集”,Atlas 900AI训练集群只需59。8秒就可完成训练,排名全球第一。

  “ImageNet-1k数据集”包含128万张图片,精度为75。9%,在同等精度下,其他两家业界主流厂家测试成绩分别是70。2s和76。8s,Atlas 900 AI训练集群比第2名快15%。