移动计算再掀 AI 变革,Arm 赋能 3nm 工艺“飞跃式”性能体验

2024-07-03 www.dnxtw.com

伴随着 AI 智能手机和 AI PC 变成 2024 消费电子产品行业最热门的发展趋势,移动终端从生产效率到娱乐,都开始发力 AI。挪动计算行业大佬 Arm 首先倾注了这一场变革,表明正处于移动终端领域的关键时期,端侧 AI 颠覆了传统智能手机“方便性”,而 Arm 恰好是背后促进变革的重要前提。

在近日举行的 Arm 技术性新闻媒体分享日上,多名 Arm 技术大咖亲临指导,为大家介绍了一个全新的 Arm 计算服务平台 ——Arm CSS for Client(Arm 终端计算子系统),主要包括最新 CPU、GPU 和软件商品。电脑系统网荣幸参与了此次主题活动,并体会到 Arm 正在进行中深入变革。

Arm 终端 CSS:赋能 AI 计算新境界

谈起 Arm 终端 CSS,Arm 终端业务部产品经营主管 Steve Hopper 老先生阐述了销售市场动力因素必须 Arm 怎样做出调整。大数据时代,大家使用智能手机的时间也正在不断提高,本人每天平均使用时间赶到 5 钟头,移动终端日常生活中的时长占有率愈来愈高,所以人们对这些设备的要求点或体验都是在升高。

在手机里,许多典型性适用场景都需要依靠强悍的计算水平来达到,如大型网络游戏的光线追踪、镜头的计算摄影水平等。自从有了 AI,这些场景的应用体验将被推到一个新的高度,这当中生成式 AI 将创新手机端生产主力,重构手机拍照、多媒体设计方法和质量,AI 图型提高将有助于手游游戏技术升级,产生更加个性化视觉上的和互动体验。

要实现这种颠覆性的体验,一个全新的计算平台能力不可或缺,从而也会引起移动应用平台的多层次变革:

应用中,AI 运用会到实体模型大小精密度间追求均衡,保证移动设备的性能做到饱和状态

框架上,弹力制度框架部署更有助于融入网络运营商、网络与其他功能升级

互动上,提升触摸显示屏的交互局限性,挖掘包括视频语音、视觉效果键入等在内的多模态交互发展潜力

计算上,计算系统必须大幅提升解决货运量和大幅度降低延迟,解决繁杂的生成式 AI 工作负载

运行内存上,带宽测试、密度高的、低延时、节能型对手机端 AI 的使用效率尤为重要,

运行内存系统上,在输出功率有限的资源移动设备上运作数十亿参数生成式 AI 实体模型,也要提升运行内存拓扑结构

基于这些宏观因素,终端 CSS 的突破将专注于实现平台水平的重要飞越,提供更无与伦比的挪动体验,随之而来的新功能和提高相当可观。

Picture 1

最先终端 CSS 是 Arm 速度最快的安卓应用软件,它采用最新 Armv9.2 CPU 集群式,搭载了 Arm 现阶段最大性能的 Arm Cortex-X925 CPU、最高效的 Cortex-A725 CPU 和更新后的 Cortex-A520 CPU。与往年公布的 TCS23(Arm 2023 全方位计算解决方法)对比:

最高值图型性能均值提高力度达到 30%

前十运用中,运用运行加速约 33%

Llama 3 LLM 和 Phi-3 LLM 的 AI 大模型性能各自提高 46% 和 42%

网页访问效率提高 60%

Picture 2

Arm 终端 CSS 在计算摄影和 AI 摄像头等方面也是有非常大的更新,如果采用 Cortex-X925 CPU 时,焦外显像性能提高了 24%,不受影响续航力,就可以获得迅速、更流畅的焦外显像体验。

A screenshot of a computerDescription automatically generated

AI 逻辑推理上,根据新一代 Arm CPU 和 GPU 升级,Arm 终端 CSS 的逻辑推理能力大幅度提高。与 Cortex-X4 对比,应用 Cortex-X925 CPU 时,逻辑推理加速 59%;与 2023 年 Arm 参照平台中的 Immortalis-G720 对比,应用 Immortalis-G925 GPU 时,AI 逻辑推理加速 36%。

图形用户界面, 应用程序描述已自动生成

手机游戏性能上,官称在《使命召唤手游》、《Roblox》、《暗黑破坏神:不朽》、《明日之后》和《堡垒之夜》五款最火网络游戏中,性能提高力度皆在 29% 至 72% 中间,而且处在同样的 120FPS 性能环境下,功能损耗也是有 30% 的显著降低。

银色的手机截图描述已自动生成

Arm 终端 CSS 还带来了很大的新功能,涵盖了第二代 Armv9.2 CPU 集群式(Cortex-X925 CPU“黑鹰”超大型核 CPU,效率最高的 Cortex-A725 和更新后的 Cortex-A520)、Arm Immortalis-G925 GPU 以及其它新一代 GPU 关键),可实现基于 3nm 芯片制造工艺里的一流 PPA,及其适用安卓系统系统的 CSS 参照软件栈、固定不动虚拟平台 (Fixed Virtual Platform,FVP),一个新的 KleidiAI 和 KleidiCV 库(侧端人工智能技术计算机视觉效果层面),也有一个全新的 Arm Performance Studio 可提供全面的专用工具自然环境,协助开发人员简单化研发流程。

现阶段新一代旗舰级高档移动终端开始步入 3nm 芯片制造工艺,在带来令人惊讶的性能和效率提高外,也面临很多阻碍与挑战。

因此,Arm 推出了全新的 3nm 物理学 IP 解决方法与终端 CSS RTL 同歩设计方案,为 3nm 处理芯片提供一流的 PPA,引进优化后的 CPU 和 GPU 关键完成,减少处理芯片优化时长,充分运用 3nm 技术性发展潜力,让合伙人的 3nm 高档移动应用平台性能如鱼得水。Arm 预估合作方对 Cortex-X CPU 的次数总体目标将突破 3.6GHz,以适应市场的需求消费者对性能的向往。

Arm 终端 CSS 还拥有丰富的扩展能力,从高端智能手机、AI PC 到智能穿戴设备,在诸多消费电子产品的细分行业都可以得到运用。例如终端 CSS 可以为 PC 用户提供专用可扩展性服务平台,它采用了的 Cortex-X925 CPU 可以实现一流的单核性能,并且通过 DSU-120(在单个 CPU 集群式内给予高达 14 个 CPU 关键)提供最佳的性能扩展性。

GPU:网络游戏性能无产阶级革命金属催化剂

对消费者来说,Arm GPU 在消费电子上的应用场景认知是比较明显的,如大型手机游戏体验、光追效果以及应用 AI 加快等。在今年的最新推出的 Arm Immortalis-G925、Arm Mali-G725 和 Arm Mali-G625 这一系列的 CPU,可以适用在包括旗舰级智能机、平板电脑电脑、智能手环和新手入门移动设备上,根据业界领先的绿色生态系统,为用户提供优异的图型性能,手机游戏体验和 AI 加快。

截图里有图片描述已自动生成

最直观的表现是 MediaTek 的天矶 9300 处理芯片 (SoC) 使用了 Arm Immortalis-G720 GPU,而性能 / 功能损耗主要表现口碑不错的 vivo X100 系列产品 OPPO Find X7 系列产品智能机都是有应用天矶 9300 处理芯片。天矶 9300 上所使用的 12 核 Immortalis-G720 GPU,相比上一代天矶 9200 的最高值性能提高达到 46%,同样功能损耗水平下,光追性能提高 46%;而同样性能下,功能损耗却减少了 40%。

Picture 4

所以目前 Arm 上线的性能最牛、效率最高的 GPU Immortalis-G925 将进一步实现图型性能的“飞越”,它对比 Immortalis-G720 的性能提高了 37%,同样手机游戏性能中的功能损耗减少了 30%。在具体的手机游戏性能体验上,Immortalis-G925 对比 Immortalis-G720 的总体性能均值提高了 46%,在其中《原神》移动端性能提高力度达到 49%,《堡垒之夜》的性能提高也是有 29%。

图形界面设计, 网站描述已一键生成

针对游戏开发人员来讲,更出色的 GPU 性能和技术适用也可以提供更大的开发设计室内空间。情景几何图形技术在游戏设计中尤为重要,它能够不断提升游戏的画面表现。为追求情景细节游戏人物角色信息真实性,《原神》和《堡垒之夜》这种人气手游在几何图形复杂性上同比增长 9% 和 11%。精彩片段上色技术让物件的线条更真实,《原神》和《堡垒之夜》的片段着色器在 GPU 里的等待时间也猛增了 27% 和 43%。

因此,Immortalis-G925 所支持的着色器核心数量提高到 24 个,增强了 50%,还引入了精彩片段预备处理 (Fragment Prepass)创新机制,在对待几何图形工作负载时,可以更有效地降低过多制作,3D渲染进程周期时间最大可缩短 43%,在提高性能和能耗等级表现得与此同时,也会减少 CPU 的负荷。

图形用户界面描述已自动生成

光线追踪技术在手游应用领域也越来越广泛。以 Immortalis-G925 GPU 来说吧,它具备硬件配置光线追踪,可设置 10 个以上的关键,并优化了光线追踪性能。在保证视觉效果准确性的与此同时性能可以提高 27%,假如开发人员挑选略微减少情景解决里的清晰度精确性,性能提高力度可赶到 52%,并减少 57% 的内存总流量,进而大幅度降低能耗。

A screenshot of a video gameDescription automatically generated

除开 GPU 新产品的性能提高,Arm 也将通过与游戏生产商等合作伙伴开展游戏绿色生态系统的合作,让游戏体验更强。现阶段 Arm 正在和 Epic Games 展开合作,在安卓应用软件上开启虚无缥缈 5 模块(Unreal Engine5) 桌面上服务平台3d渲染器,让游戏的突出和图型实际效果匹敌桌面端,在其中用以光线追踪的 Lumen 阳光照射解决方法已对于 Arm GPU 进行改善,完成游戏服务器质量的光照效果。

Arm 还和谷歌、MediaTek 对于安卓系统动态性性能架构(Android Dynamic Performance Framework, ADPF)相关行业进行合作。谷歌搜索所提供的 API,让开发人员可以根据移动设备的即时热配置信息来判定和改进应用程序的体验和性能,进而降低能耗发烫,增加游戏使用时间。MediaTek 也可通过响应式游戏技术 (MAGT),提高自适应能力功能和水平,减少开发难度。

图形用户界面, 应用程序描述已自动生成

在前文提到的 Arm Performance Studio 中,Arm 也进一步增加了 Frame Advisor 数据分析工具,让开发人员可以更高效、直接地开展图型数据分析和提升。Arm 也将通过以一系列的 GPU 工具网络资源,对游戏开发人员进行全面的绿色生态系统适用。

AI 性能:用其所长充分发挥算率潜力

除开图型性能和技术,AI 性能都是 GPU 上不可或缺的部分,将来的游戏可能借助大量 AI 技术,特别是图形分割或目标检测这类工作负载比较适合在 GPU 上运行。

A graph of a performanceDescription automatically generated with medium confidence

在官方对比中,数字图像处理层面(包含切分和科学分类),对比 TCS23 的 Immortalis-G720 GPU,Immortalis-G925 GPU 的性能主要表现提高了 41%,在非常取样每日任务中应用神经元网络变大图象时,性能提高了近 30%;但在自然语言理解和语音转文本层面,性能提高力度更是达到了 50%。

结束语

Arm 此次的技术共享,释放出了一个清晰讯号,那便是 Arm 已经携手合作伙伴全方位转为 3 纳米技术工艺技术技术时期,并全力以赴下注潜力无穷的 AI 行业。伴随着 Arm 转型成为超算平台服务提供商,不断地在半导体材料技术上取得突破,不仅可以产生硬件配置性能的提高,还通过全方位完备的技术解决方法,帮助企业最有效率地打造和生产产品,并且所有技术与产品都可以覆盖和适用每个价格区间以及多个日用品类移动终端,从而让用户可以拥有出色的应用体验。

广告宣传申明:文章正文所含的对外开放跳转页面(包括不限于网页链接、二维码、动态口令等方式),用以传递更多信息,节约优选时长,结论仅作参考,电脑系统网全部文章内容均包括本声明。

相关阅读