市场资讯
NeoChrom GPU - 全新的2.5D加速器,针对STM32上实现丰富UI进行了大量的硬件优化
发布日期:2022-05-12    


STM32UI硬件优化 


意法半导体持续地改善其微控制器产品的图形性能,我们于今日宣布推出NeoChrom GPU,一款内置于特定STM32U5产品中的新型图形处理单元。该技术优化了翻转、旋转、缩放等动画性能,通过新硬件IP在整体上加快了纹理映射和alpha混合的速度。计算任务被分流到NeoChrom GPU上,由此大大提高了每秒帧数。因此,像STM32U5这样的微控制器可以运行之前无法实现的复杂界面。意法半导体的客户在此基础上成功完成了产品开发。此外,从TouchGFX 4.19.1开始,我们确保为NeoChrom GPU提供支持。


目录

  • 从Chrom-ART到NeoChrom GPU

  • 什么是Chrom-ART和NeoChrom GPU?

  • NeoChrom GPU如何集成到TouchGFX生态系统?

  • 从NeoChrom GPU到真实性能

  • 图形性能面临哪些挑战?

  • 什么是独特的的STM32实现?

  • 下一步是什么?


  • 从Chrom-ART到NeoChrom GPU

  • 什么是Chrom-ART和NeoChrom GPU?


熟悉意法半导体技术的读者可以猜到,NeoChrom GPU正是Chrom-ART的升级版本。Chrom-ART是多款STM32 MCU中内嵌的2D加速器(DMA2D),可优化内存访问,以便更快速地操作图像。许多来自意法半导体合作伙伴的工具和产品都使用了Chrom-ART加速器,例如Crank的Storyboard、Twilio的Microvisor,或者来自TouchGFX实现者PsiControl的interface。仅列举3个名称,相比之下,NeoChrom GPU在借鉴相同理念的同时,实现了更大范围的优化。得益于具有双线性和点取样特性的纹理映射功能,新技术提供了新的绘图加速并支持动画。因此,过去需要桌面PC机GPU卡才能实现的应用,现在可以在微控制器上运行。



图形特征

Chrom-ART

NeoChrom   GPU

支持的格式

ARGB8888, ARGB4444, ARGB1555, RGB888, RGB565

A8.A4, L8

AI44,   AI88

CLUT256条目),YUV

RGBA8888,   ARGB8888

RGBX8888,   XRGB8888

RGB888,   RGB565, RGBA55551

A8,   A4.A2, A1

压缩的TSc4TSc6TSc6A

基于命令列表

绘图

矩形填充

矩形填充像素、线条、三角形、四边形绘制8xMSAA抗锯齿

位图复制

复制alpha混合像素格式转换

复制

alpha混合,色彩键入像素格式转换

纹理映射

任何角度旋转、缩放、镜像、3D透视正确投影、纹理映射(具有双线性和点取样特性)



Chrom-ARTNeoChrom之间的参数对比

               


  • NeoChrom GPU如何集成到TouchGFX生态系统?

从时间顺序看,Chrom-ART代表意法半导体的第一次图形优化尝试。此后,我们收购了TouchGFX,并通过TouchGFX Designer、Simulator和Generator构建了一个完整的生态系统。因此,意法半导体从一开始就将NeoChrom GPU集成到这些工具中。TouchGFX Designer包含的示例代码展示了在圆形显示器上60帧/秒来显示平滑动画。更重要的是,它展示了当NeoChrom GPU关闭时对帧速率的影响,可帮助决策者理解其重要性。同样,纹理映射控件将自动使用新的GPU(如果MCU支持)。因此,新IP在TouchGFX内的即时集成是意法半导体的生态系统凝聚力的见证,而不是简单的功能列表。


  • 从NeoChrom GPU到真实性能

  • 图形性能面临哪些挑战?



 STM32U5

STM32U5

图形性能面临两个主要挑战:每时钟周期指令数限制和内存问题。第一种通常与架构创新有关。微控制器因尺寸和低功耗因素,存在ALU和FPU限制,但改进后的制造工艺允许容纳更多晶体管,以便处理更多任务。NeoChrom GPU遵循这样的趋势,硬件IP能够加速更多类型的图形计算。第二个挑战更为棘手,也更加关键,因为内存始终是一种稀缺资源。虽然STM32U599将采用2.5 MB内部RAM(能够存储两个帧缓冲区),但许多嵌入式系统需要外部RAM。问题在于这会带来显著的性能损失.。


  • 什么是独特的STM32实现?


为了应对第二个挑战,NeoChrom GPU针对STM32 MCU进行了硬件优化。例如,STM32U5依靠一个8位8线串行外设接口(OSPI)或一个200 MHz频率的16位高速接口(HSPI)与外部存储模块对接,以加快到L2缓存的读取速度。类似地,L1缓存可以直接访问内部RAM中的两个832 KB帧缓冲区。因此,由于能够快速访问实时渲染图像所需的所有数据,细分曲面速度显著加快。简而言之,我们的工程师通过减少访问纹理和其他素材所需的时间来优化性能,最终可使渲染速度提高到到以前的六倍。


  • 下一步是什么?


NeoChrom GPU的首个行业反馈非常积极。虽然许多MCU制造商通过类似的IP来加速图形计算,但特定的STM32优化和TouchGFX生态系统促使许多早期alpha测试者都采用NeoChrom GPU,而非竞争对手的解决方案。该新技术已经应用于TouchGFX 4.19,一些alpha客户已使用即将面市的STM32U599开发套件,开发即时可用的UI。意法半导体还将在其他即将面市的微控制器中应用NeoChrom GPU,我们也将在相关产品上市后更新该博文。



相关阅读: