首页 > 汽车技术 > 正文

NVIDIA BlueField DPU 助力 VAST 数据平台优化 AI 工作负载

2024-08-16 16:59:34·  来源:NVIDIA英伟达网络  
 
图片


随着对复杂 AI 功能的需求不断增加,VAST Data 推出了 VAST 数据平台(Data Platform),该平台现已通过 NVIDIA BlueField DPU 进行增强。这项创新专为满足 AI 驱动数据中心的严格要求而量身打造,并优化了 AI 工作负载和数据管理。


本文介绍了 NVIDIA BlueField DPU 如何为 VAST 带来显著的性能和效率提升,确保更快的数据访问和处理速度,同时降低功耗和空间需求。


管理 AI 工作负载面临的挑战


优化 AI 工作负载需要管理大量非结构化数据,并确保高速数据访问以及保持强大的数据安全性。传统的数据存储和处理系统经常面临延迟、效率低下和可扩展性问题,这些问题可能会影响 AI 应用程序的性能。此外,实时数据处理和严格安全性的需求也增加了有效管理 AI 工作负载的复杂性。


NVIDIA BlueField DPU 的优势


NVIDIA BlueField-3 DPU 使组织能够满足现代 AI 工作负载的苛刻要求,确保更快的数据访问速度、强大的安全性和更高的整体效率。继续阅读如下内容,详细了解 NVIDIA BlueField DPU 为 VAST 数据平台和 AI 工作负载带来的具体优势。


提高存储效率、数据完整性和安全性


将 NVIDIA BlueField DPU 集成到 Vast 数据平台代表着存储处理技术的重大飞跃。通过将基本存储操作卸载到 DPU,可以降低功耗和空间,同时提高存储网络带宽、提高性能并确保可扩展性。这些增强功能对于处理 AI 应用程序中常见的大量数据至关重要,有助于提高数据访问速度和处理速度。


VAST Data 的最新产品代表了 AI 环境数据平台的关键发展,将高密度存储与前沿的 NVIDIA BlueField DPU 技术相结合。这种强大的组合可确保出色的性能、最大限度地提高效率,并为最具挑战性的 AI 环境提供所需的可扩展性。


图片

图 1.NVIDIA BlueField DPU 可增强服务器、存储控制器和存储机箱的存储性能、安全性和效率


在 VAST Data 的传统架构中,CNode(计算节点)是负责运行存储协议和管理服务的 x86 服务器。VAST 的独特方法是将 NVIDIA BlueField DPU 集成到其平台中。这种集成将基本存储操作从 CPU 卸载到 DPU,从而提高存储网络带宽并降低功耗。卸载到 DPU 可以减少所需的专用 CNode 数量,因为 DPU 可以更高效地处理必要的计算任务。


同样,通过减少计算节点,还可以减少对外部网络交换机的依赖,从而降低所需交换机的端口数量以及管理这些端口的复杂性和成本,从而简化网络架构。NVIDIA BlueField DPU 通过卸载和隔离存储功能、辅助并行数据服务以及在 AI 环境中提供块存储服务,显著增强了 I/O 操作的处理能力,从而实现更精简、更高效的基础设施,并减少了实现相同性能水平所需的物理服务器数量。


NVIDIA BlueField DPU 通过多种方式增强 VAST 数据平台,包括:


提高 I/O 性能:BlueField 可助力 NVMe 存储访问,以超过 60 GB/s 的速度处理数据,从而优化数据密集型应用程序的访问速度。

更好的存储性能:BlueField DPU 支持高达 400 Gbps,可以提高吞吐量和 I/O 效率。GPUDirect Storage 和 RDMA over Converged Ethernet (ROCE)等功能可以实现高效、低延迟的数据传输,对于高速数据密集型应用程序至关重要。

服务质量:每台 GPU 服务器均配备专用的 BlueField-3 DPU,为 VAST 并行服务操作系统提供支持。这使每个 DPU 都能够读取和写入 VAST 数据平台的共享命名空间,而无需跨容器协调 I/O,从而消除争用。

安全加速:BlueField DPU 可卸载加密和深度数据包检测等关键安全任务,减少 CPU 上的计算负载,并提高整体系统性能。BlueField-3 还无需使用内核驱动来处理 IO,这种方法可减少攻击面,并最大限度地减少主机漏洞的潜在影响,尤其是在多租户环境中。

提高效率:BlueField DPU 显著增强了存储处理能力,降低了功耗和空间需求,同时提高了存储网络带宽。


成果


将 NVIDIA BlueField DPU 集成到 VAST 数据平台后,取得了令人瞩目的成果:


性能增强:BlueField-3 从主 CPU 卸载计算密集型任务以提高性能,这对于 AI 应用程序是至关重要的。

服务质量:通过在容器内操作共享命名空间,每个 GPU 服务器都有一个专用的 BlueField DPU,可实现与数据节点的直接通信,从而减少延迟和跳数,从而简化 I/O 操作。

提高效率:该平台通过降低 77% 的功耗和 73% 的机架空间需求,为数据中心提供更具可持续性的解决方案。

强大的安全性:增强的安全功能可确保数据完整性并防止未经授权的访问。


这些进步使得 VAST 数据平台成为提高 AI 驱动数据中心的性能和效率的关键组件。该平台能够以更低延迟和更高安全性处理大量数据的能力尤为显著,为 AI 创新提供了坚实的基础。


通过集成 BlueField,VAST 可加速运营、简化安全管理并增强监控功能。BlueField 提供改进的数据服务和强大的安全功能,包括用于实时洞察和快速异常检测的高级遥测功能。这种集成不仅优化了性能,而且还减少了对大量硬件的需求,从而提高了系统效率和经济效益。BlueField DPU 是推动 VAST 数据平台(专为现代 AI 数据中心定制)先进性能和效率的关键组件。


VAST Data 与 NVIDIA 之间的合作对于推进 AI 基础设施发展至关重要,并彻底改变了 AI 驱动数据基础设施的格局。通过利用 NVIDIA BlueField-3 DPU,VAST Data 成功增强了其 AI 云架构,提供了前所未有的性能、安全性和效率。这种集成使 VAST Data 能够将关键的网络、存储和安全任务从 CPU 卸载到 DPU,显著减少数据中心的占用空间和功耗。


总结


NVIDIA 和 VAST Data 合作,为现代企业和服务提供商量身打造强大、可扩展且安全的 AI 基础设施。此集成解决方案可提高 AI 工作负载的性能,并简化广泛 AI 系统的部署和管理。


此外,NVIDIA BlueField-3 DPU 使 VAST Data 能够采用零信任安全模型,从而确保数据隔离和针对威胁的强大防护。在多租户环境中,安全高效的数据管理至关重要,这是一项基本功能。DPU 还支持直接在 AI 服务器中集成存储和安全处理服务,并实现服务质量(QoS)功能,以协调 DNode(数据节点)之间的 I/O,从而实现真正的线性可扩展性并消除数据服务争用。


随着 AI 不断推动创新和重塑行业,VAST Data 和 NVIDIA 之间的合作体现了将先进的 DPU 技术融入数据中心架构的优势。

分享到:
 
反对 0 举报 0 收藏 0 评论 0
沪ICP备11026620号