Tensilica全球发布四款视频处理引擎,包括H.264 Main Profile支持

本文作者:admin       点击: 2006-12-12 00:00
前言:
Tensilica公司今日发布预先定制的四款用于SoC设计的Diamond Standard VDO(ViDeO)处理器引擎,可以支持多标准多分辨率视频模块。面向移动手机和个人媒体播放器(PMPs)应用,这些视频子系统的设计是完全可编程,可以支持所有流行的VGA和SD(也称D1)视频编解码算法。包括H.264  Main Profile、VC-1 Main Profile, MPEG-4 Advanced Simple Profile (ASP)和MPEG-2 Main Profile。其算法的分辨率支持720x480 (NTSC) 和720x576 (PAL),同时也支持较低分辨率,如QCIF、QVGA、 CIF 和VGA。
Diamond Standard VDO 引擎在处理器上通过软件方式来实现所有视频关键处理的功能,包括网络抽象层(network abstraction layer,)、图像层、条代层(slice layer)、比特流解析、以及熵解编码,包括在H.264 Main Profile解码器中进行CABAC(Context-Adaptive Binary Arithmetic Coding)解码。大多数其他解决方案都忽略了该功能,或采用独立的复杂且不可编程的硬件模块,或利用700MHz普通CPU来实现该功能(这种方法明显增加功耗)。通过在指令集扩展中实现对CABAC的支持,Tensilica创造出一款低频低功耗, 面积少于典型CABAC硬件一半的CABAC模块。
Diamond VDO系列提供Baseline Profile和Main Profile两种解决方案 –Main Profile提供更佳的数据压缩率和视频质量,是面向高级手机和PMP应用的D1或者更高分辨率的更好的编解码机制。大多数其他的SoC视频解决方案只实现Baseline Profile的视频效果。


四款Diamond Standard VDO引擎可满足多变的市场需求
- Diamond 381VDO – 仅提供Baseline Profile和 Simple Profile的解码,是主流手机、PMP和其他移动多媒体设备的理想选择。该产品支持:
• H.264Decoder –Baseline Profile @ D1, 5 mbps, 30fps
• MPEG-4 Decoder–Simple Profile @ D1, 6 mbps, 30fps
• VC-1/WMV9 Decoder–Simple Profile @ D1, 6 mbps, 30fps
• MPEG-2 Decoder–Main Profile @ D1, 6 mbps, 30fps
- Diamond 383VDO – 提供Baseline Profile和Simple Profile的解码和编码。可支持Diamond 381VDO所支持的全部解码器,以及MPEG-4Encoder–Simple Profile @ D1, 6 mbps, 30fps。
- Diamond 385VDO – 仅提供核心Main Profile和ASP Profile的解码器,是高级手机、PMP的理想选择。该产品支持:
• H.264Decoder–Main Profile @ D1, 5 mbps, 30fps
• MPEG-4 Decoder–Advanced Simple Profile @ D1, 6 mbps, 30fps
• VC-1/WMV9 Decoder–Main Profile @ D1, 6 mbps, 30fps
• MPEG-2 Decoder –Main Profile @ D1, 8 mbps, 30fps
- Diamond 388VDO – 提供Main Profile的解码器和编码器。除支持Diamond 385VDO所用的全部解码器外,还支持MPEG-4Encoder–Advanced Simple Profile @ D1, 6 mbps, 30fps。
Tensilica总裁兼CEO Chris Rowen表示,“Tensilica已准备好向那些将开发高品质视频产品的半导体制造商和系统 OEM公司提供全部经过测试的新产品解决方案。希望创造出象HiFi音频引擎一样的成功方案。HiFi音频引擎已被广泛应用于数十款流行的手机设备中,其中包括摩托罗拉公司最新KRZR和RIZR手机。”





基于Xtensa处理器技术的架构
为开发新的Diamond Standard VDO系列,Tensilica采用了Xtensa®可配置且可扩展处理器技术,创造了一个双处理器的子系统模块,包括一个集成DMA引擎,能以极低时钟速率实现完整D1 Main profile的解码和ASP编码(完整的H.264 Main profile解码仅需172MHz,而MPEG-4 Advanced Simple Profile (ASP)的解码仅需156MHz)。
Diamond VDO双核架构包括基于Xtensa架构配置得到的一个流处理器和一个像素处理器。流处理器指令集对视频数据(熵解码、运动向量的预测等等)的串行式处理进行了优化。流处理器需要32K字节的本地数据存储器,40K本地指令存储器。其指令的宽度优化到32位。像素处理器指令集采用SIMD(单指令多数据)技术,对像素数据的并行式处理进行了优化。像素处理器需要40K本地数据存储器,24K本地指令存储器。处理器之间的内部通信是通过一个128位的直连接口实现的,而外部视频引擎接口通信是通过2个32位的总线实现的。
Tensilica在Diamond VDO系列中定义了400多条视频专用指令,与通用DSP或通用32位微处理器相比,性能显著提升。这些指令是针对视频处理中性能要求苛刻的部分优化得到的,这些算法部分包括:CABAC,它可得到H.264 Main profile视频的更高压缩效果;CAVLC(Context-adaptive variable-length coding),是一种用于H.264 Baseline Profile和 Main Profile的低复杂度压缩算法;Deblocking:去块效应,可减少在高压缩视频码流中的由块效应所引起的失真;Transforms:各种变换(H.264中有很多种变换,在这是说支持多种变换)进行空间域的压缩变换,类JPEG处理;运动补偿和运动估计,用于在低速码率条件下得到高质量画面的算法。
Tensilica提供全套软件包 —— 包括解码器和编码器
Tensilica针对新Diamond VDO引擎开发了编码器和解码器,客户能直接从Tensilica购买到软硬件完整的解决方案,SoC设计工程师不用依赖第三方应用提供商。Tensilica同时提供全套与之适配的软件开发工具链,包括一个基于ECLIPSE框架的高级集成开发环境、一个世界级编译器、一个周期精确(cycle-accurate)并兼容SystemC的指令集仿真器、以及完整的工业标准GNU工具链。另外,Tensilica广泛的合作伙伴网络提供操作系统、调试工具、ICE解决方案、以及其他有助于将Tensilica处理器快速设计进其产品中的支持。


基于处理器的视频解码的灵活性
新Diamond VDO引擎相比与基于硬件的视频加速器和常规CPU结合的传统方式会相当受欢迎。首先,Diamond VDO IP核减少了系统主控CPU的全部视频解码任务– 包括全部比特流解析。传统的硬件加速器仅可减少如运动估计那样的像素处理工作,而将大部分计算负担(经常需要100MHz的持续的主控CPU开销)交由系统控制器来完成。
第二,传统解决方案包括了一个CPU和一个硬件加速器,当数据通过系统总线在CPU和加速器间进行传输时会产生大量的功耗 –通常出于方便,其他方案不计算这部分功耗,这样使得他们宣称的硬件加速器模块本身的消耗很低。
第三,当Diamond VDO引擎没有被用于进行视频处理时,可随时以一种相当于有500多 Dhrystone MIPS处理能力的通用CPU 来执行其他系统任务 – 相反一个特定的视频硬件模块是不能被重用的。
第四,Diamond VDO引擎是可编程的,因此可支持今后出现的视频标准。
最后,Diamond VDO引擎面积小,其面积在130nm工艺下仅有8mm2(包括处理器逻辑和内部存储器)。

SoC的小面积低功耗解决方案
Diamond Standard VDO系列针对移动应用而优化,比其他竞争产品具有更小面积、更低的功耗。通过运用Xtensa处理器的一种特征-细粒度门控时钟再结合可编程的电源管理指令(可以降低各种负载情况下视频处理的功耗),其动态功耗被降至最低。进一步的能耗利用率的提升是通过DMA引擎和流处理器与像素处理器间的接口实现,而后者令外部存储器带宽要求降至最低。在节省面积方面,例如,Diamond 383VDO,其面积包括存储器仅占10 mm2;全功能Diamond 388VDO可在D1分辨率下,提供完全的H.264 Main profile解码和MPEG-4 ASP编码的支持,而其包括存储器的面积仅有 12 mm2,且在TSMC 0.13G工艺技术下运行速度为200MHz。