近日,Microsoft宣布建设一系列跨大陆数据中心超级集群,以满足未来人工智能模型的训练需求。这些新设施将连接多个数据中心,通过高速网络实现高效数据传输,目标是支持具有多达数十万亿参数的人工智能模型。
10 月,Microsoft 在其位于威斯康星州的芒特普莱森特数据中心园区推出了第一个节点,该节点连接到位于佐治亚州亚特兰大的设施。这些数据中心不是普通的设施;Microsoft 将它们称为“Fairwater”集群。它们是两层楼的建筑,采用液冷技术直接连接到芯片上,几乎不消耗水资源。未来,Microsoft 计划将这些集群扩展到数以万计的不同 GPU,以满足不同的工作负载需求。
通过互联数据中心,Microsoft能够训练更大规模的模型,并为新设施选择土地成本低、气候宜人、电力资源丰富的地点。尽管Microsoft尚未透露用于连接这两个数据中心的具体技术,但业界有多种选择,包括思科的51.2Tbps路由器和博通的新Jericho4硬件,可以有效连接相距1000公里的数据中心。
同时,英伟达也在积极推动网络技术的发展,以满足AI训练的需求。Microsoft在高性能计算环境中广泛使用Nvidia的InfiniBand网络协议,展示了其对高效数据传输的承诺。减少人工智能工作负载中的带宽和延迟问题仍然是研究人员关注的重点。
人工智能领域取得了重大进展。此前,谷歌的DeepMind团队发布了一份报告,显示通过在训练过程中压缩模型和适当安排数据中心之间的通信,可以克服许多挑战.
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
