当前位置: 附加器 >> 附加器市场 >> 大举攻向数据中心市场Arm新服务器芯片
芯东西(ID:aichip)作者
心缘编辑
漠影
芯东西4月28日报道,今日,英国芯片设计公司Arm公布了NeoverseV1和N2服务器芯片平台的最新性能数据,其处理能力比上一代N1提高了40%~50%。
NeoverseV1平台首次支持可伸缩矢量扩展(SVE),N2平台则率先采用全新Armv9架构的平台,拥有比N1更高的核心数、性能和能效。两者都支持新的数据类型和指令集,并针对高性能计算和AI等工作负载做了优化。
去年9月,Arm发布新的NeoverseN2和V1平台,但并未提及详细性能。如今Arm正式公开两款全新平台的性能、能效、总拥有成本等细节,以及腾讯、阿里等合作伙伴采用该设计的案例,并宣布基于N2的芯片预计将在今年下半年推出。
尽管Arm并未直接对比Neoverse平台与英特尔、AMD产品的性能,但从图中可以看到,Neoverse系列芯片已经非常有竞争力。
同时,Arm也发布了构建基于NeoverseV1和N2平台高性能SoC的关键部件——CMN-。
Arm基础设施事业部高级副总裁兼总经理ChrisBergey称,Arm想改变行业对部署基础设施的思维,每一个创新者都不应该被要求在性能与能耗之间进行抉择,而Neoverse平台提供了两者兼得的最佳解决方案。
一、ArmNeoverse已走过十年历程
Arm基础设施业务高级副总裁ChrisBergey说:“现在是时候让Neoverse跨越所有基础设施了。”
从起步至今,ArmNeoverse已经走过十年历程。
早期其基础设施内核是Cortex-A72,有出色的能效比、媲美竞争对手的单核性能表现,通过合作伙伴的智能网卡、DPU、物联网芯片在网络及边缘应用场景中发挥价值。
随后,年,NeoverseN1和CMN-Mesh网络将线性性能扩展到非常高的内核数量,更加适合云服务。据其分享,N1单核性能已经比肩或超过传统SMT线程的性能。
Arm技术专家称,尽管其竞争对手陆续推出新的芯片,但它们仍无法与N1的单线程性能匹敌。
通过NeoverseV1和N2,Arm想进一步改变业界对部署基础设施的看法,使得大家无需在性能与能效之间做选择,而是两者兼得。
Arm还将帮助合作伙伴在单芯片或多芯片封装中,都能以同质或异质的方式提供解决方案。
据Arm技术专家介绍,Arm与领先的晶圆代工厂深入合作,在多个先进的工艺节点上开发出了性能和功耗优化的POPIP。
随着ProjectCassini和ArmSystemReady启动,Arm的标准和认证项目计划正持续推进,并逐步扩展到基础设施和物联网边缘。
今天,Arm正式揭晓NeoverseV1和N2平台的技术细节。
二、NeoverseV1:机器学习工作负载可提升4倍
NeoverseV1是Arm强调性能优先的新型计算系列的第一个平台,客户可基于该架构灵活地为大型数据中心服务器设计芯片。
这是Arm迄今设计的最宽微架构,Arm预期它在多核配置中能胜过市场上其他产品。
Arm为其加宽了微架构,并增加了缓冲区和队列的深度,因此在运行中能容纳更多运行中的指令,支持高性能和百万兆级计算等市场应用。
与N1相比,NeoverseV1带来了50%的性能提升,在各种矢量工作负责中性能优化约1.8倍,通过各种新的指令,机器学习工作负载最高可优化4倍。
客户可以自由选择适当的IO尺寸,并利用芯片集和多芯片功能来提高内核数量和性能,不过采用的方法是组合可提高良品率、降低成本的小型芯片。
法国芯片公司SiPearl和韩国电子通信研究所(ETRI)的高性能计算(SoC)均可展现这些设计元素的优势,这被Arm看作是高性能计算的发展方向。
V1新增的一个关键功能是SVE,可使其在每核性能方面领先,使用SVE的代码寿命更长,并为SoC设计者提供更好的灵活性。
SVE为开发者提供了一套全新的矢量编程和数据操作工具,能直接取用相同代码进行自动矢量化,处理速度相比NEON可提高3.5倍。
由于SVE与矢量长度无关,因此相同代码不加修改即可在V1上运行,如果在V1上加倍SVE矢量的宽度,对应处理速度也几乎提速1倍。
三、NeoverseN2:单线程性能提升了40%
另一种芯片微架构ArmNeoverseN2平台,是第一个基于Arm公司最新Armv9架构的内核,也是第一个具备SVE2功能的平台。
NeoverseN2在安全性、能耗以及性能方面都有全面提升,并能为用户减少TCO的每瓦性能表现。相比于N1,N2在保持相同水平的功率和面积效率的基础上,单线程性能提升了40%。
N2具备良好的可扩展性,可以横跨从高吞吐量计算到功率与尺寸受限的边缘和5G应用场景,并在这些应用中带来优于N1的表现。例如,在云端上提升1.3倍的NGINX,在5G边缘应用上提升1.2倍的DPDK数据包处理。
SVE2是Armv9的重要特性之一,能显著提升从云到边缘的性能效率、可扩展性及安全性。
和SVE一样,SVE2也属于与矢量长度无关的指令集,用户只需编写、编译一次代码,即可在各种硬件上运行,还能充分利用可用的矢量带宽。
在机器学习、数字信号处理、多媒体、5G系统等广泛应用场景中,SVE2不仅带来大幅性能提升,还带来了SVE具备的编程简易性及可移植性等优势。
四、新Mesh互连技术助力打造异构SoC
构建基于V1和N2高性能SoC的关键要素,就是ArmNeoverseCMN-Mesh互连技术。
CMN-为可扩展、高内核数、高性能SoC奠定了基础,在此基础上,新一代ArmNeoverseCMN-被Arm称作是业界最先进的Mesh互连技术,在每个矢量上进一步提升了性能——从内核的数量、缓存的大小,到附加内存和IO设备的数量和类型。
对于基于V1的高性能计算平台而言,支持高带宽DDR5和HBM内存系统至关重要,而CMN-即可实现这一点。
其另一个
转载请注明:http://www.aideyishus.com/lkjg/3640.html