当前位置:数码通 > 数码

借助 NVIDIA BlueField DPU 将加速计算提升到新水平

来源于 数码通 2023-10-09 18:34

世界各地的超级计算中心正在利用 NVIDIA Quantum InfiniBand 网络上的 NVIDIA BlueField DPU,将加速计计算提升到新的水平。

在欧洲和美国,HPC 开发人员 正在利用 NVIDIA BlueField-2 DPU 内的 Arm 内核和加速器为超级计算机提供动力。

洛斯阿拉莫斯国家实验室 (LANL) 与 NVIDIA 进行了广泛的多年合作,旨在将计算多物理场应用的性能提高 30 倍。

LANL 研究人员预计,使用在 NVIDIA Quantum InfiniBand 网络上运行的 DPU(数据处理器)可显着提高性能。这将利用 BlueField 和 NVIDIA DOCA 软件框架实现计算存储和模式匹配等领域的技术创新。

打开 DPU 的 API

这些努力还将有助于进一步定义 OpenSNAPI,它允许任何人通过应用程序接口控制 DPU。这是统计计算框架(统一通信ication Frameworkk)的一个项目。统一通信框架是一个旨在实现HPC应用异构计算的联盟。其成员包括Arm、IBM、NVIDIA、美国国家实验室以及美国的一些大学。

得益于其创建的支持 DPU 的存储系统,LANL 已经体验到了网络计算的强大功能。

Accelerated Box of Flash(ABoF,如下图所示)将固态存储与 DPU 和 InfiniBand 加速器相结合,以加速 Linux 文件系统的性能关键部分。它的性能是同类存储系统的 30 倍,并将成为 LANL 基础设施中的关键组件。

一位研究人员在最近的 LANL 博客中表示:“ABoF 使计算更接近存储,最大限度地减少数据移动,从而使模拟和数据分析工作流程更加高效。”

德克萨斯州打造云原生超级计算平台

德克萨斯州高级计算中心 (TACC) 最近也开始在 Dell PowerEdge 服务器中使用 BlueField-2。它将在 InfiniBand 网络上使用 DPU,使其 Lonestar6 系统成为云原生超级计算的开发平台。

TACC 的 Lonestar6 为德克萨斯农工大学、德克萨斯理工大学和北德克萨斯大学以及多个研究中心和教员的众多 HPC 开发人员提供服务。

MPI 加速

在 TACC 东北 1,200 英里处,俄亥俄州立大学的研究人员演示了 DPU 如何将流行的 HPC 编程模型运行速度提高 26%。

他们通过卸载消息传递接口 (MPI) 的关键部分来加速 P3DFFT(一种用于许多大规模 HPC 模拟的数学库)。

俄亥俄州立大学计算机科学与工程教授 Dhabaleswar K. (DK) Panda 在他领导的 MVAPICH 开源软件团队中推广 DPU 工作,他表示:“DPU 就像忙碌的高管处理工作的助手。他们将成为成为主流是因为它们可以加速各种工作负载。”

HPC 中心和云中的 DPU

对于运行 HPC 模拟应用程序(例如药物发现或飞机设计)的超级计算机来说,高达两位数的性能加速令人震惊。 Panda 表示,云服务可以利用这些加速来提高客户的生产力。Panda 已收到来自多个 HPC 中心的代码请求。

Quantum InfiniBand 网络和 NVIDIA SHARP 功能帮助他高效地完成工作。

“其他人仍在谈论网络计算,而 InfiniBand 已经为其提供了动力,”他说。

达勒姆开发负载平衡

欧洲的多个研究小组正在利用 BlueField DPU 来加速 MPI 和其他 HPC 工作负载。

例如,英格兰北部的达勒姆大学正在开发软件,以在 16 节点 Dell PowerEdge 集群上使用 BlueField DPU 来平衡 MPI 作业的负载。该项目首席研究员 Tobias Weinzierl 表示,该软件将为世界各地的 HPC 设施更高效地处理更好的算法铺平道路。

剑桥大学和慕尼黑 DPU 申请

剑桥大学、伦敦大学和慕尼黑大学的研究人员也在使用 DPU。

伦敦大学学院正在探索如何为 BlueField-2 DPU 上的主机系统安排作业。例如,它的功能可用于在主机处理器之间移动数据,以便在需要时可以找到数据。

Dell PowerEdge 服务器中的 BlueField DPU 通过卸载剑桥数据驱动发现服务的主机CPU 的安全策略、存储框架和其他任务,最大限度地提高系统性能。

与此同时,作为 EuroHPC 项目的一部分,慕尼黑工业大学计算机架构和并行系统小组的研究人员正在寻找使用 DPU 卸载 MPI 和操作系统任务的方法。

在美国,佐治亚理工学院的研究人员正在与桑迪亚国家实验室合作,利用 BlueField-2 DPU 加速分子动力学研究。一篇描述他们当前工作的论文表明,该算法可以加速高达 20%,而不会损失模拟的准确性。

不断扩大的网络

本月初,日本研究人员宣布推出搭载新版 NVIDIA H100 Tensor Core GPU 的系统,该系统将配备更快、更多的 的 NVIDIA Quantum-2 InfiniBand 网络平台。

NEC 将使用 H100 为筑波大学计算科学中心打造一台计算能力约为 6 PFLOPS 的超级计算机。研究人员将利用该系统进行气候学、天体物理学、大数据、人工智能等方面的研究。

与此同时,像Panda这样的研究人员已经开始思考如何利用BlueField-3 DPU的核心功能。

他打趣道:“这就像聘请有大学学历的行政助理,而不是高中文凭的行政助理,所以我希望能够卸下越来越多的工作。”

原标题:ISC22 | HPC 研究人员利用 NVIDIA BlueField DPU 为网络计算的未来奠定坚实的基础

文章来源:【微信公众号:NVIDIANVIDIA企业解决方案】欢迎添加关注!转载文章时请注明出处。

审稿编辑:唐子红
-->
登录后参与评论