上新了!亚麻云|聚焦高性能算力,基于英伟达 H200 GPU 的新一代实例正式可用!

2024-09-13 15:12:26·  来源:亚马逊云科技  
 

亚马逊云科技特别推出《上新了! 亚麻云》,每月与您相约,一文快速了解重磅产品动态!

01、重磅上新

亚马逊云科技本月重磅新品聚焦高性能算力, 不仅上线了基于 NVIDIA H200 及 L40S 构建的两款最新 GPU 实例,同时也带来全新发布的高性能计算托管服务 Amazon Parallel Computing Service,全力加速生成式 AI 及高性能计算。

基于 H200 的 Amazon EC2 P5e 

实例及基于 L40s 的 

Amazon EC2 G6e 实例正式发布

亚马逊云科技推出全新的 Amazon EC2 G6e 实例,由 NVIDIA L40S Tensor Core GPU 提供加速支持。相比上一代 G5 实例,Amazon EC2 G6e 实例的计算性能可提升高达 2.5 倍,而与 P4d 实例相比,推理成本则可降低 20% 左右。

Amazon EC2 G6e 实例旨在服务于机器学习和空间计算等 GPU 密集型工作负载。它能够支持部署大型语言模型(参数量高达 130 亿)、生成式 AI 模型(图像/视频/音频扩散模型)以及创建大规模 3D 模拟和数字孪生体等应用场景。

Amazon EC2 G6e 实例目前在美国东部(弗吉尼亚北部、俄亥俄州)和美国西部(俄勒冈州)三个区域开放,提供按需、预留、竞价实例以及节省计划等多种购买模式。开发者可通过亚马逊云科技管理控制台、Amazon CLI 和 Amazon SDK 等渠道启动使用。

*点击上方链接观看视频

亚马逊云科技正式推出全新 Amazon EC2 P5e 实例,由 NVIDIA H200 Tensor Core GPU 提供加速支持。相较上代 P5 实例,Amazon EC2 P5e 实例的 GPU 显存容量提升 1.7 倍,内存带宽提升 1.5 倍。

Amazon EC2 P5e 实例专为大型语言模型(LLM)、生成式 AI 模型以及高性能计算 (HPC)等 GPU 密集型工作负载而设计。在 LLM 推理方面,Amazon EC2 P5e 实例可实现显著性能提升和成本节省。

例如,在单个 Amazon EC2 P5e 实例上部署 4050 亿参数的 meta LLaMa 3.1 模型,吞吐量可比双 P5 实例提高 1.72 倍,成本降低 69%。此外,Amazon EC2 P5e 实例适用于模拟、药物发现、天气预报等内存密集型 HPC 应用。亚马逊云科技还预告将推出 Amazon EC2 P5en 实例,采用 PCIe Gen5 连接 CPU 和 GPU,网络延迟更低。

Amazon EC2 P5e 实例现已在美国俄亥俄州区域通过 Amazon EC2 Capacity Blocks for Machine Learning 开放使用。总的来说,Amazon EC2 P5e 是亚马逊云科技面向人工智能和机器学习及 HPC 工作负载推出的新一代 GPU 加速实例。

*点击上方链接观看视频

开启 HPC 云端新时代,亚马逊云科技

推出 Amazon Parallel Computing Service

为解决传统 HPC 集群建设和运维成本高昂且缺乏弹性扩展能力的痛点,亚马逊云科技推出了全新 Amazon Parallel Computing Service(Amazon PCS)。这是一项全托管服务,可以使您基于亚马逊云科技轻松运行和扩展高性能计算(HPC)工作负载。 

Amazon PCS 为用户构建并管理整个 Slurm 集群环境,包括控制节点、计算节点、作业队列、远程可视化等。Slurm 作业调度系统是 HPC 领域事实上的标准,现被全球众多科研机构和企业广泛使用,它提供强大的作业调度、监控和资源管理功能,支持在大规模节点上高效展开并行作业。Amazon PCS 使用户可以在熟悉的 Slurm 环境中工作,而无需操心底层基础设施。

同时,借助亚马逊云科技的弹性云资源,Amazon PCS 根据需求无缝扩展 HPC 集群的计算规模,支持从零扩展至数千个实例,以高性价比的方式满足各种大规模计算需求。Amazon PCS 也支持构建一体化的 HPC 集群,可与 Amazon EFS、Amazon FSx、Amazon EC2 等亚马逊云科技核心服务深度集成,让用户可以无缝接入高性能云存储、GPU 加速实例等资源,构建更强大的 HPC 环境。

Amazon PCS 为广泛的计算密集型或数据密集型工程和科学工作负载而设计,涉及计算流体动力学、天气模拟、有限元分析、电子设计自动化等领域。目前,Amazon PCS 已帮助全球多家科研机构高效运行 HPC 负载。

图片

Marvel Fusion 是一家总部位于德国的聚变能源初创公司,致力于创造无限零排放能源。Marvel Fusion 的首席执行官莫里茨·冯德林登说:“我们很高兴 Amazon PCS 服务将提供高可用性和易于升级的 HPC 集群管理能力。它将使我们的科学家和 IT 员工能够在几小时内利用 PCS 的最新功能,而不是之前需要的数周计划和额外开销。”

02、「更多新品」

Amazon Bedrock 支持跨区域推理

Amazon Bedrock 现已支持跨区域推理,这一新功能可在不同亚马逊云科技区域间动态分配计算资源,应对突发流量高峰。

开启该功能后,按需付费模式的客户可获得高达 2 倍的区域配额上限,并在高峰期获得更出色的服务可用性和性能表现。客户可选择数据流向的区域范围,满足数据驻留和合规要求,请求会优先分配至最近区域以降低延迟。跨区域推理无需额外路由费用,计费遵循请求发出区域标准。该功能可显著提升应用的可靠性、性能和效率。

Amazon OpenSearch Service 

持 Amazon Graviton3 实例部署 

(中国区域新品)

Amazon OpenSearch Service 新增支持基于 Amazon Graviton3 处理器的实例类型,包括计算优化 C7g、通用 M7g 和内存优化 R7g 实例。

与上一代 Graviton2 相比,Graviton3 实例性能提升高达 25%,提供高达 30Gbps 的增强网络带宽和 20Gbps 的 Amazon EBS 带宽。新实例类型支持所有 OpenSearch 版本及 Elasticsearch 7.9 和 7.10 开源版本。用户可通过 Amazon OpenSearch Service 控制台或 API 无缝将域名升级到新的 Graviton3 实例类型。

Amazon Backup 新增

 SAP HANA on Amazon EC2 的跨区域、

跨账户备份复制功能

Amazon Bedrock 现已支持跨区域推理,这一新功能可在不同亚马逊云科技区域间动态分配计算资源,应对突发流量高峰。

通过此功能,客户可以通过 Amazon Backup,在亚马逊云科技不同区域和账户中,生成并存储额外的 SAP HANA 快照副本。这些快照副本为源账户提供了额外的保护,以防意外或恶意删除、灾难或勒索软件导致业务中断。客户可使用亚马逊云科技 Backup 控制台、API 或 CLI 开始使用 SAP HANA 的跨区域和跨账户备份,并可按需还原或创建跨区域跨账户副本,降低停机风险,确保满足灾难恢复和业务连续性要求。

分享到:
 
反对 0 举报 0 收藏 0 评论 0
沪ICP备11026620号