Arm终端CSS革新AI芯片架构,引领移动计算新时代

13次阅读

共计 1767 个字符,预计需要花费 5 分钟才能阅读完成。

近日,Arm 在京举办技术媒体分享会,隆重推出了面向消费电子设备的全新计算子系统——终端计算子系统(CSS)。该平台融合了 Armv9.2 架构的 CPU 集群、强大的 Immortails GPU、CoreLink 互联系统 IP 及系统内存管理单元(SMMU),并首次在终端领域实现了基于三纳米工艺的 CPU 和 GPU 物理实现。

作为移动处理器市场的重要支柱,Arm 的每次更新都会引发行业的广泛关注。本次推出的终端 CSS 再次展现了其在 AI 与性能方面的强大潜力,势必成为下一代消费电子设备的关键驱动力。

Armv9.2 架构:性能与 AI 的双重飞跃

终端 CSS 的核心在于其搭载的 Armv9.2 CPU 集群,其中包含了 Cortex-X925、Cortex-A725 和 Cortex-A520 三种全新核心。Cortex-X925 作为新一代超高性能核心,主频突破 3.6GHz,单线程性能相较上一代提升 36%,AI 性能增幅更是达到了 46%。这一代的 Armv9.2 架构不仅继承了前代的安全性与稳健性,还在矢量加速、机器学习等领域进行了深度优化。

在 AI 推理性能方面,Cortex-X925 的提升尤为显著,达到了 59%。当双颗 Cortex-X925 核心协同工作时,终端 CSS 的 CPU 集群在推理任务上的性能提升最高可达 170%。而 Cortex-A725 作为效率核心,则在性能效率上提升了 35%,能效提高了 25%。通过优化的预取器和更大的 L2 缓存,L3 流量减少了 20%,从而为中高端设备提供了更加高效的 AI 运算支持。

Immortails GPU:卓越性能与能效的完美平衡

在 GPU 领域,Immortails-G925 同样表现出色。这款 GPU 支持从 10 核到 24 核心的灵活配置,既适合高端智能手机,也能覆盖 PC 等高性能设备的需求。与上一代相比,其性能提升了 37%,而在保持相同游戏性能的前提下,功耗降低了 30%。这一特性对于追求长续航的小型移动设备尤为重要。

Immortails-G925 还引入了一项名为“片段预处理”的新技术,这项技术无需应用进行对象或原语排序,从而有效减少过度绘制现象,提高渲染效率。在 Arm 内部测试中,渲染线程周期缩短了高达 43%。此外,其光线追踪性能提升了 52%,内存流量降低了 57%,进一步降低了功耗,为复杂场景的图形处理提供了坚实保障。

Kleidi 软件:赋能开发者,构建 AI 生态

为了更好地支持开发者,Arm 推出了全新的 Kleidi 软件套件,其中包括 KleidiAI 和 KleidiCV 库。KleidiAI 专注于优化端侧 AI 和计算机视觉工作负载,通过与 PyTorch、TensorFlow 等主流 AI 框架的集成,大幅提升了开发效率。而 KleidiCV 则针对计算机视觉应用进行了专门优化,尤其在传统算法与神经网络的协同工作中表现优异。

今年,Arm 还与 OpenCV.ai 展开合作,使得安卓开发者能够更方便地将 OpenCV 集成到项目中,享受 KleidiCV 带来的性能提升。这一举措进一步丰富了 Arm 的开发者生态,为智能终端的应用开发提供了更多可能性。

性能分析与开发者支持

Arm Performance Studio 是 Arm Mobile Studio 的升级版,新增了对 Arm Linux 的支持,使得开发者能够利用 Streamline CPU 分析工具进行更全面的性能评估。同时,CSS 参考软件栈与固定虚拟平台(FVP)的结合,帮助合作伙伴在流片前加速软件开发进程。

此外,Arm 与多家行业领先企业合作,推出了丰富的开发者支持计划。这些计划包括在线培训、技术论坛和技术支持服务,为开发者提供了全方位的帮助。通过与 Visual Studio Code、Eclipse 等知名 IDE 的深度集成,Arm 确保其开发工具能够无缝融入开发者的日常工作中,极大提升了开发效率。

ALL FOR AI:智能时代的未来方向

随着 AI 需求的不断增长,智能终端市场迎来了前所未有的发展机遇。Arm 终端 CSS 及其配套软件工具,为开发者提供了强大的技术支持,使其能够快速响应市场需求,推出创新性的产品。无论是高性能计算、AI 推理还是计算机视觉,Arm 都展现出了行业领导者的实力。

展望未来,Arm 将继续深化其软硬件生态建设,推动计算技术的持续进步。通过不断优化性能与能效,Arm 将为开发者和消费者带来更加优质的体验,为智能时代注入更多活力。

正文完
 0