当前位置: CompoTech China > 业界资讯 >
 

GPU领域再迎重大创新——全新Imagination DXTP GPU将功效提升20%

本文作者:翔煜 商瑞       点击: 2025-03-13 16:56
前言:
功效比超高的DXTP GPU IP将为图形计算与边缘AI应用SoC的创新提供巨大的帮助
Imagination于不久前正式发布了DXTP GPU IP,这款新产品的亮点在于,在标准图形工作负载下,其能效比(FPS/W)相比前代产品实现了高达20%的提升。作为GPU IP行业的领导者,截至2023年的公开数据显示,搭载Imagination IP授权的芯片累计出货量高达110亿颗。这些芯片广泛应用于移动设备(包括智能手机)、汽车、消费电子产品和电脑等多个领域。

此次功效得到大幅提升的DXTP GPU的发布,正值在DeepSeek等大模型技术的推动下,边缘AI设备广泛兴起的产业转型期,功效更高的GPU IP将为边缘端侧AI SoC的开发提供巨大的支持。同时,DXTP GPU也是Imagination继不久前发布比锁步和双备份成本低很多的、已获得ASIL-B认证的GPU分布式功能安全机制后又一个重大技术持续进步。
 

而回顾GPU的技术升级浪潮,可以发现Imagination始终以创新为核心动力,在近几年不断推出具有突破性的IP产品,从根本上重塑了图形计算和人工智能领域的发展蓝图。因此,本文以Imagination在GPU领域的持续创新为例,通过盘点该公司近年来在GPU技术领域内的创新,分析其长期坚持的技术创新战略,以及这一战略与国内芯片设计公司在各个领域内协同创新的机会,共同探索如何成为行业引领者实现双赢,支持国内芯片企业去实现更多的创新与突破。

Imagination:持续的技术创新助其成为GPU行业的引领者
2021年,Imagination推出了业界首款在移动平台上支持硬件光线追踪的GPU IP——Imagination CXT GPU,这一创举在移动图形处理领域具有里程碑意义。在CXT诞生之前,移动设备受限于硬件性能和功耗等因素,图形渲染的真实感和沉浸感远不及桌面设备。
 

CXT通过引入Imagination开发的PowerVR Photon架构的光线加速集群(RAC),成功解决了这一难题。RAC采用了先进的光线处理算法,能够高效处理光线的传播、反射、折射和阴影计算等复杂操作。
 

CXT的光线追踪技术能够实时计算光线的传播路径,生成逼真的光影效果,使得游戏中的物体与场景之间的光影交互更加自然。此外,CXT在功耗控制方面也进行了优化。它采用了动态功耗管理技术,根据光线追踪任务的复杂度自动调整硬件资源的分配,在保证图形质量的同时,尽可能降低能耗。这使得移动设备在运行支持光线追踪的游戏时,不会因为功耗过高而导致发热严重或续航时间大幅缩短,为移动光线追踪技术的普及奠定了坚实的基础。
 
 

2023年,Imagination推出新一代的IMG DXT GPU,在CXT GPU取得成功的基础上,进一步发展了光线追踪技术。DXT  GPU具备可扩展的光线追踪功能,这一创新特性使厂商能够根据不同的应用场景和设备性能需求,灵活调整光线追踪的精度和复杂度。对于高端游戏和专业图形设计领域,DXT能够提供更高质量的光线追踪。在有复杂渲染需求的大型游戏中,DXT不仅可以实现全域光照效果,并且模拟真实世界中光线在场景中的多次反射和折射,使整个游戏场景更加明亮和自然。同时,DXT上的扩展光线追踪技术在专业图形设计、建筑设计和影视特效制作等许多领域,可以帮助设计师实现更加真实的渲染效果和更加逼真的虚拟场景,提高成品质量和视觉冲击力。 
 

Imagination在其DXT GPU中还加入了多项创新,例如“2D双速率纹理映射”技术,该技术能在同一时间处理两种不同分辨率的纹理,通过智能切换纹理分辨率,在保证图形质量的同时,显著提升纹理处理速度,减少内存带宽占用。在复杂2D场景渲染中,例如手机游戏中的角色和场景绘制,它能根据画面元素的远近和重要程度,动态调整纹理分辨率,近景和关键元素采用高分辨率纹理以呈现精细细节,远景元素则使用低分辨率纹理,从而在不影响视觉效果的情况下,大幅提升渲染效率,优化图形处理性能。 
 
 

2023 年末,为了帮助桌面和数据中心客户实现高性能的云端GPU创新解决方案,Imagination推出了DXD GPU IP。该款GPU的创新之处在于首次将Imagination的API覆盖扩展至DirectX,这一举措显著提升了DXD与Windows平台上的应用程序和游戏的兼容性。同时,Imagination 的硬件虚拟化技术 HyperLane 在DXD中发挥了关键作用,该技术支持在单个GPU上安全且独立地运行多达八个操作系统,这意味着当 DXD部署在服务器中时,能够支持多达八个用户同时进行游戏,极大地提升了服务器的使用效率,降低了云游戏的运营成本,并为云游戏行业的发展带来了创新的运营模式。
 

时间来到2024年9月,针对全球汽车智能化的需求,Imagination推出了其算力最高可扩展至24 TOPS INT8的DXS系列GPU,该系列IP不仅为智能驾驶舱和先进驾驶辅助(ADAS)等应用所需SoC带来澎湃的算力,而且转为诸如汽车处理器等对安全性要求极为严苛的应用,开发了结合GPU的计算模式特点并大幅降低成本分布式功能安全机制(DSM),这为汽车和工业等越来越多需要GPU的图形处理能力和计算能力的电子系统带来了巨大的创新。

 

通过引入DSM机制,Imagination DXS GPU能以比锁步或者功能备份等功能安全机制小得多的资源开销实现ASIL-B级别的功能安全,这在降低了高昂的成本的同时还提升了效率。采用DSM分布式安全机制的DXS GPU已经通过严格的ASIL-B认证,汽车SoC开发商仅需增加大约10%的芯片面积就实现了功能安全,如果结合该公司的HyperLane硬件虚拟化技术,还能大幅度提升这些汽车SoC的计算性能和效率。以自动驾驶系统为例,DXS能够实时、安全地处理海量的传感器数据,而HyperLane则通过虚拟化技术隔离数据和处理过程,在确保系统的安全性和可靠性的同时,为自动驾驶芯片的创新提供了坚实的支持。

集大成的D系列收官之作:DXTP 融合创新服务端侧AI
新推出的Imagination DXTP GPU是其D系列的巅峰之作,汇聚了前代产品的众多优点。它不仅继承了DXT系列GPU的图形处理能力和能效优势,例如“2D双速率纹理映射”技术,还融合了DXS系列的计算能力和能效优势,包括用于AI加速的大容量本地内存。在能效方面,DXTP GPU表现出色,在常规图形工作负载下,其功耗效率(FPS/W)比前一代产品DXT提升了高达20%。

在端侧AI应用场景中,这一特性对主控SoC尤为关键。以智能家居为例,搭载DXTP的芯片可以利用大容量本地内存快速存储和处理AI模型数据,用智能摄像头去实时识别画面中的人物、物体,还能借助DXTP的高性能计算能力对识别结果进行快速分析,例如判断是否有异常行为等,然后及时向用户推送警报信息,极大提升了智能家居主控SoC的智能特性和响应速度。

DXTP GPU卓越的能源效率使其能够在相同的功耗预算下实现更高的帧率(FPS),这使得下游相关方能够在不影响电池续航的前提下,为终端用户带来更先进的图形处理体验和计算功能。DXTP GPU为SoC芯片设计公司带来两个方面的创新:首先是“利用率”显著提升,它能将理论上的TFLOPS高效转化为实际的FPS,实现了极高的效率,同时将功耗浪费降至最低。

其次是DXTP GPU提供了芯片资源使用灵活性,它能够处理图形或AI工作负载,或者同时处理这两种计算需求,因此在AI功能已成为智能手机等设备差异化竞争的焦点的今天,DXTP能够支持在GPU上无需额外的芯片面积来专门用于AI处理,也不会牺牲用户界面或游戏体验,这体现了对芯片资源的高效灵活利用。

搭载DXTP GPU的新一代SoC已在设计之中
DXTP GPU提供DXTP-48-1536和DXTP-64-2048两种配置,两款产品均已经向芯片设计公司出售了授权,因此预计搭载该GPU的SoC将很快可以提供给系统厂商使用。其中,DXTP-64-2048在1GHz的运行频率下,具备64 GPixel/s的处理速度,能够实现2 TFLOPS的FP32、4 TFLOPS的FP16以及8 TOPS的INT8峰值计算性能;DXTP-48-1536同样具备48 GPixel/s的处理速度、1.5 TFLOPS的FP32、3.0 TFLOPS的FP16和6 TOPS的INT8性能。
 

在功能特性上,DXTP引入全新的灵活任务调度机制。该机制可实时监测各个任务的状态和资源需求,依据任务优先级和实时需求动态分配计算资源。当同时运行图形渲染和AI计算任务时,能合理分配资源,确保系统高效运行,提升整体性能和响应速度,进一步提高能源利用效率,有力推动边缘AI应用发展。 

 
DXTP 的均衡架构设计同样是一项创新。这种架构通过优化渲染计算的吞吐量,相较于前代产品实现了高达50%的性能提升。通过扩展缓存容量和系统级带宽,DXTP 构建了更高效的通道,能够更有效地替代 GPGPU 完成各类复杂计算工作,完成数据存储和传输。在处理大规模数据集时,缓存能够暂存频繁访问的数据,从而减少读取时间;而更高的系统级带宽则确保了数据在不同组件间快速传输,有效避免了传输瓶颈。无论是实时渲染大型3D游戏,还是处理AI计算任务中的海量数据,DXTP 都能凭借其架构优势高效且稳定地执行。

此外,借助Imagination的低开销HyperLane技术,DXTP支持完全安全的GPU多任务处理,可同时运行图形和计算任务,极大地提升了系统灵活性。例如,在智能汽车场景中,车辆行驶时,DXTP 一方面要负责渲染高精度的 3D 地图,为驾驶员提供清晰直观的导航界面,实时呈现路况和周边环境信息;另一方面,还要同步处理来自多个传感器的 AI 计算任务,如对摄像头捕捉到的图像进行实时分析,识别行人和其他车辆,以辅助自动驾驶决策。这两项任务对计算资源的需求都很高,且对处理的及时性和准确性要求严格,DXTP 凭借 HyperLane 技术,能将图形渲染和 AI 计算任务高效分配到不同的虚拟环境中,让它们互不干扰地稳定运行,保障了驾驶过程中的安全性和用户体验。
 

生态合作创新支持开发者更方便完成设计并复用成果
Imagination不仅在硬件技术上不断创新,还积极构建丰富的软件生态系统,推动 GPU 技术的广泛应用,展现了其全方位支持芯片设计企业及其用户去实现创新的能力。

Imagination与Android和Linux生态系统紧密协作,致力于挖掘GPU的计算潜力。通过与这些主流操作系统的深度整合,Imagination为开发者打造了一个更加便捷、高效的开发环境。同时,Imagination为开发者们提供了丰富的创新资源和强大的工具,包括定期更新的驱动程序、详尽的指南和示例代码,支持OpenGL/ES、OpenCL、Vulkan等多种标准。开发者可以根据项目需求选择最合适的开发框架,从而提升开发的灵活性和效率,为创新应用的开发提供了有力支持。

在图形处理、GPU计算和人工智能领域,Imagination与UXL基金会开展合作,利用其oneAPI等开放标准支持开发者去降低创新门槛并充分复用创新成果。例如通过结合使用Imagination的OpenCL工具包,相较于开源人工智能方案,能够实现高达4倍的人工智能应用性能提升。这一合作成果为人工智能开发者提供了更加强大、高效的开发工具,加速了人工智能应用在GPU上的开发和部署,推动了人工智能领域的创新发展。

Imagination还拥有一系列功能丰富的开发者工具,可用于性能分析与调试,同时还提供带有示例和指南的软件开发工具包(SDK)。这些工具和SDK可从开发者门户网站下载,并且已经被众多游戏工作室长期使用。Imagination的开发者社区充满活力,便于分享经验、解决问题。社区活动和竞赛激发创新,技术交流让开发者掌握最新动态,而竞赛则促进了思想交流和应用创新,营造了一个充满创新活力的生态环境。
 

通过前面介绍的这些创新产品、技术和生态举措,可以发现Imagination一方面致力于从算力指标、整体功耗、芯片面积、功能安全和架构均衡性等基础性能上挖掘性能极限正在重新定义GPU,另一方面还在架构灵活性、用户体验、特色功能和AI支持能力等产品特色功能上支持SoC设计企业及其用户去引领或者适应新的商业模式,第三还联合产业内外各类创新主体携手推动这些技术更快转化为智能化转型的强大动力,共同去引领边缘AI时代的创新发展。在边缘AI快速发展的今天,Imagination在GPU领域的持续创新,不断为SoC设计企业带来可以引领市场的全新功能,还为整个图形计算和人工智能计算在端侧智能领域带来了新的发展机遇。