微处理器的心脏 开放式IP Core大车拼

本文作者:admin       点击: 2005-06-10 00:00
前言:
文/任苙萍

微处理器的任务是去内存中取指令数据,然后分解指令并对指定的操作数进行处理,其能力取决于指令集的操作能力和指令的位长度。从指令组织上划分,微处理器可分为CISC和RISC架构。愈见风行的手持装置因算术逻辑运算要求比PC低,复杂程度也较小,一般多采用RISC架构的微处理器。RISC最大优点是:用小指令集、多缓存器,指令执行简单快速;且统一用单周期指令,从根本上克服了CISC指令周期数长短不一,造成偶发性不稳定,致使执行失常的问题。

现今芯片设计多朝向SoC的目标努力,而微处理器正是SoC的核心,因此 “嵌入式微处理器” (Embedded Micro Processor)的发展自然也就格外引人瞩目;偏偏微处理器又是IC设计中最复杂、也最具有挑战性的工作,随着高阶电子装置市场的渐露曙光,如何强化嵌入式处理器并提升IP Core设计技术,因而更显得刻不容缓。

就组成构造来看,微处理器本身虽可视为一个IP Core内嵌到SoC中,但其本身也是由ALU(算术逻辑单元)和乘法累加器(MAC)等众多IP(Intellectual Property)所构成。为加速通信和多媒体中数字信号所经常遇到的循环乘加算法,IP Core Provider便在RISC的基础上增加硬件的乘法累加器(MAC)等原属DSP核中的关键组件,以双核协同工作的模式,各发挥所长,有效提高数据处理能力和传输速度,成为今日32位手持嵌入式装置所用微处理器的主要架构。

在所谓 “知识经济时代”,IP无疑是最令人顾盼的资产。因此本期微处理器的产业特辑,将就几个热门的IP Core为读者做一简略介绍。
  
<b>ARM:独揽九成手持装置市场</b>
90年代初期,来自于英国的ARM(安谋国际科技)率先推出32位RISC微处理器芯片系统,其虚拟的 “技术授权” 概念,为半导体业树立了新的商业模式;采用ARM技术的微处理器遍及各类电子产品,在汽车、消费娱乐、工业控制、网络、储存和无线等领域皆可见其影踪。
由于是开放式授权,因此用户在市场上可在多家系统厂进行选择。ARM Core具有高性能、低成本和低功耗等特点,且授权用户众多,其中不乏世界顶级的半导体和系统公司。为支持和补强ARM现有的RISC微处理器内核和SoC IP,ARM亦未敢忽略软核的开发工作,希望透过操作系统端口和软件设计的统合式服务,为厂商降低产品开发风险并缩短上市时间。

1990年11月成立于英国的ARM,原名Advanced RISC Machine有限公司,是苹果计算机旗下Acorn公司和VLSI Technology的合资企业;Acorn曾推出世界首个商用单芯片RISC处理器,挟此得天独厚的优势,ARM成功开发首个低成本RISC架构,并迅速在市场上崭露头角。1991年ARM更将触角伸及 “嵌入式” 系统,发表ARM6TM系列处理器,并将它授权给VLSI使用,随后Sharp和GEC Plessey,乃至于德州仪器和Cirrus Logic也相继成为授权用户,自此ARM-Based的势力范围便急遽扩大。

采用RISC架构的ARM微处理器一般具有如下特点:
1. 体积小、低功耗、低成本、高性能;
2. 支持Thumb(16位)/ARM(32位)双指令集,能与8 bit/16 bit组件良好兼容;
3. 大量使用缓存器,指令执行速度更快;
4. 大多数数据操作都在寄存器中完成;
5. 寻址方式灵活简单,执行效率高;
6. 指令长度固定。

ARM提供一系列内核、微处理器和系统芯片方案。由于所有产品均采用一个通用的软件体系,在合成上可以同一套语法一路畅行到底。ARM处理器核目前有6个系列:ARM7、ARM9、ARM9E、ARM10E、SecuRCore、ARM11,还有Intel的Xscale微体系架构及StrongARM等。ARM7、ARM9、ARM9E和ARM10为6个通用处理器系列,每一个系列提供一套相对独特的性能来满足不同应用领域的需求。其微处理器系列家族如下:

ARM仅靠技术授权给合作公司生产各具特色的芯片,再由其根据不同应用领域加入适当的外围电路,从而形成特有的ARM-Based微处理器芯片进入市场。在MP3芯片市场上占有举足轻重地位的Philips,即是以ARM为核心,搭配一颗低功耗的DSP来达成;采用这种架构的好处在于ARM所带来的高度弹性,有助于产品后续的扩充,DSP则可专职处理声音。

ARM在导入成本上拥有相当优势。目前ARM在手持装置市场囊括90%以上的市占率,采用ARM-Based的核心,可有效缩短应用程序开发与测试的时间,并降低了研发费用。此外,由于ARM在校园教育深耕已久,在众多莘莘学子的心理占有率可说是一党独大,也使人才流通较容易,可节省培训成本,自然也就成了许多IC设计公司和系统业者的首选。另顺带一提的是,微软专为行动商务人士所开发的Windows CE接口,虽可支持多种嵌入式处理器;但基于Windows CE的Pocket PC却只能支持ARM一种,据悉是因为微软在对多种嵌入式处理器进行评估后认为,ARM是一种性价比较好的选择。

<b>MIPS:数字家电影音的领航者</b>
在许多高成长率的 “量产型产品” 市场,MIPS(美普思科技)架构的市占率不遑多让;其中最为人所津津乐道的部分为:缆线调制解调器94%、VDSL调制解调器93%、互动数字电视(IDTV) 40%、缆线视讯转换器76%、DVD录像机75%、游乐器76%、商务彩色复印机73%等。专注开发应用广泛阵容庞大的产品,包括嵌入式微处理器核心、指令集架构、系统控制器,以及软件工具;从要求低功耗的智慧卡市场,到要求高效能的网络与消费性产品,MIPS都能提供最合适的核心来改善消费者的使用经验。

MIPS专注开发高效能32和64位架构与核心,亦采用开放的授权模式,目前MIPS-Based平台已广泛应用于高成长的嵌入式市场,如数字视讯转换器、数字电视、DVD烧录机、宽频存取装置、数字相机、激光打印机和网络路由器等。MIPS的强处之一在于其产业体系阵容坚强,网罗多方软硬件厂商参与,全球已有约164种解决方案可支持在MIPS-Based平台上所进行的各项开发工作;这些产品包含应用和软件数据库、编译器、EJTAG/ICE、评估板、硬件支持组件、Java技术、逻辑分析仪、操作系统、硅智财(IP)、模拟工具和模型、软件开发工具以及设计服务。获得MIPS授权的客户都可立即运用这些工具以缩短产品上市时间。

MIPS是全球数字消费性与商业系统应用产业中,标准微处理器架构及核心的领导供货商。该公司主导众多的架构联盟以开发32/64位嵌入式RISC解决方案,并将IP授权给半导体厂商,ASIC开发商以及系统OEM厂。MIPS架构是业界最广泛支持的处理器架构之一,由业界标准工具、软件、以及服务所构成的基础建设,具有高兼容性、延展性及客制化程度。

就研发工程师的角度来看,开发工具的延伸性极为重要。而MIPS的软件工具包括MIPS SDE Lite这套供外界免费下载的GNU工具链,以及一套完整的MIPSTM Software Toolkit,内含SDE、MIPSsimTM指令集仿真器、DSP函数库与支持方案。另其规划完善的训练课程,让客户亲身参与操作,以便能立即着手开发MIPS-Based方案。

MIPS架构是20年前由美国史丹福大学John Hennessy博士所开发出,随着时间的演变MIPS架构已经发展成专为嵌入式应用而设计的高阶处理器架构。稍早问市的24K核心系列在初期授权的客户成长率就创下MIPS的新记录,除适合各种高效能、低成本的应用,更适合标准与协议不断演进的产品。24K是可合成的核心系列,客户可针对不同制程作个别设定,该核心提供业界32位可合成核心的最高时脉,让SOC研发业者有充裕的升级空间来建置更多具有软件弹性的功能以符合未来升级的需求。

自2002年起即成为MIPS授权客户的Micronas,是由多家半导体厂商所组成的事业群,在全球各地均设有营运据点,是消费性产品与汽车电子系统市场中尖端IC与传感器系统解决方案的领导供货商。继采用MIPS IP开发数字电视专用的SoC后,Micronas计划以MIPS32 4KEcTM与新型24KcTM与24KfTM核心针对高阶视讯转换器(STB)与数字电视(DTV)设计单核心与多核心芯片,之所以选择24K核心系列最主要原因,是该核心采用标准化的开放式核心协议(OCP)互连架构,其开放式核心协议的研发业者能以通用的芯片内接口,轻易整合内存控制器、总线互连组件、及其它标准型的外围组件,能轻易重复运用标准型SOC IP以加快产品上市时程。

英飞凌也在今年3月决定采用MIPS32?4KcTM及MIPS32 M4KTM 处理器核心作为开发未来VoIP方案的标准平台。MIPS对国内厂商的吸引力也日渐扩增中;为加强技术深度,掌握上游零组件的设计整合能力,选择将经营触角延伸至数字消费性电子领域的华硕,也决定采用MIPS32 4KE核心、MIPS消费性音效平台以及软件工具套件,交由子公司祥硕科技针对数字消费性电子市场开发各种多媒体应用SoC,而联阳半导体亦将采用MIPS32?Pro版本的旗舰级核心4KEm?KEp攵钥尚绞侄嗝教蹇P3、PMP,以及其它影音多媒体应用等SoC解决方案。这项授权协议也将进一步为MIPS拓展PMP这块迅速崛起的市场。
     
<b>ARC:可配置核心价值浮升</b>
在 “同中求异” 的竞逐压力下,许多系统商已不能满足于一成不变的核心产品;在客制化呼声日益高涨下,可配置的IP终于也闯出另一天地。ARC International就是这么一家公司,该公司已分别与无晶圆厂半导体公司Broadcom以及协议堆栈开发商TTPCom签署了一份核心授权协议,configurable的价值已渐受芯片开发商和系统OEM厂商所注目。

继在2.75G基频引擎CBEmacro采用ARC核心后,TTPCom近来的授权协议意味着ARC的可配置处理器将首次应用于手机基频处理器;而已经取得ARM和MIPS核心授权的Broadcom公司表示,ARC的全系列可配置微处理器和工具可协助其扩展CPU选择范围,以满足数以百计的客户要求。额外的核心有助于我们针对每种应用选用最好的技术。

ARC也是投身32位的处理器核心厂商之一,所不同的是, “可配置”而满足客制化需求为其卖点,供实时嵌入式操作系统和发展工具之用。ARC日前刚为ARCTM600和ARCTM 700处理器家族增添新成员—Floating Point Extensions(FPX,浮点延伸指令集),在不用借助CPU辅助处理器下,即可发挥数理函式的最大效能。藉由导入IEEE 754编译浮点功能,ARC可比同级产品减少90%的接脚数;ARC FPX可直接在硬件中执行,对需要数理精确度的数列有大幅加速作用,可应用在图形/影像处理、打印机、GPS、自动控制和仪器等范畴。

ARC的可配置组态(Configurable)处理器技术已获得美国专利暨商标局(USPTO)核准,并取得相关专利,主要是针对如何运用内含原型与扩充逻辑线路描述的链接库产生处理器核心描述语言模型的程序与系统,以及和使用者所需的核心配置性及扩充性相关之使用者输入。ARC International表示,其ARChitect处理器配置工具正是这项技术最实际的应用例证;ARChitect是一套以Java为基础的设计工具,所有ARC处理器的授权使用者,都已开始使用这套工具来简化核心设计的流程。

为拓展OEM客户群,可配置处理器开发商不得不绞尽脑汁提供比传统架构更多的好处。传统的浮点运算处理方法需要辅助处理器的一臂之力,才能符合IEEE-754的标准,而这将会增加芯片设计的复杂度和面积,甚至比主要的CPU还占空间;而ARC的FPX可加速通过IEEE-754验证,其编译组件已收纳在组件库中。这个FPX延伸性架构可达成近似辅助处理器的效能,使用最频繁的加/减和乘法指令说明,都已导入硬件中,而其它IEEE规格的元素则收在软件中。此外,它也提供了辅助器所欠缺的弹性,利用ARChitect的组态工具,单芯片的设计师能随意选择所需的延伸架构,像是只要单精准度或双精准度,或两者兼具。ARC的单精准浮点指令集已开始供应,双精准预计将在2005第二季出货。其与传统浮点辅助器的规格和特性比较如表3。

传统上,芯片开发商会采用单指令集架构,然后想尽办法在各种产品线和新一代产品上重复提炼这项IP的价值,以不断积累经验。然而,即使已与ARM或MIPS建立长期的合作关系,芯片公司和系统OEM逐渐开始愿意取得ARC或Tensilica等IP供货商的可配置核心。这是因为ARM或MIPS等固定核心的实现容易受到原有架构的限制,授权用户虽可以调整缓冲存储器大小和组织等参数,但除非给予特别授权,否则不得径自对架构做任何更动。
消费电子的发展趋势是可配置、客制化和差异化,但cost-effective仍是不变的议题,而这正是可配置核心与传统ASIC相较的迷人之处,它可有效地搭配特定的应用要求,也意味着可使用硅晶面积更小的处理器核心,这对大量应用而言是十分重要的。
  
<b>Tensilica:代理RTL区块所有工程</b>
新兴的ARC核心,可容许自行控制增删指令,甚至拿掉缓存器、闸电路或减少模块,但更有甚者,另一家可配置核心供货商更进一步宣称其可配置处理器也可替代用于数据功能的硬联机引擎—Tensilica表示,其最新产品—XtensaLX可将数据直接移至执行管线,以减少读取指令、译码和执行的功耗,这使得适当配置的Tensilica核心在电源效率上能够与硬联机方法一较高下。

Tensilica创立于1997年,经营目标为满足量产型嵌入式应用产品对于最佳化特殊应用处理器解决方案持续成长的需求。透过推出Xtensa这款可程序化与可延伸的处理器核心,Tensilica成为市场中惟一拥有自动化方案的厂商,运用省时的专利制程制造客制化的处理器核心,并提供一套完整的软件研发工具环境,让客户能在数小时内建立一个新的组态。
Tensilica公司的Xtensa V是第一个专为嵌入式单芯片系统而设计的微处理器,可自由配置、弹性扩张,并可以自动合成的处理器核心。Xtensa V为了让系统设计工程师能弹性规划、执行单芯片系统的各种应用功能,Xtensa V在研发初期就已锁定成一个可以自由配置的架构。

Xtensa V处理器具有不同于其它传统式的嵌入式处理器核心,改变了单芯片系统的设计规则。采用 Xtensa V的技术时,系统设计工程师可以挑选所需的单元架构,再加上自创的新指令与硬件执行单元,就可以设计出比其它传统方式强大数倍的处理器核心。Xtensa V产生器可针对每一个处理器的特殊组合,自动有效地产生出一套包括操作系统,完善周全的软件工具。

Xtensa V的指令集架构(ISA)拥有专利权。这个现代化的32位处理器的结构特色是有一套专门为嵌入式系统设计、精简而高效能的16与24位指令集。其基本结构拥有80个RISC指令,其中包括32位ALU、6个管理特殊功能的缓存器、32或64个普通功能32位缓存器。这些32位寄存器都设有加速运作功能的窗口。Xtensa V处理器的结构技术先进、指令精简,可以帮助系统设计师大量缩减编码的长度,从而提高指令的密集度并降低能耗。这对于高合成的单芯片系统ASIC而言,是降低成本的重要关健。Xtensa V的指令集构架包括强劲的分支指令,例如:经合成的比较-分歧循环、零开销循环和二进制处理,包括漏斗切换和字段抽段操作等。浮点与向量DSP是Xtensa V结构上的选购单元。

而另一款Xtensa LX处理器是SoC设计与众不同的处理器核心,相较于手动调整、缓存器转移层级(RTL)设计、不可程序化的硬件区块,可提供毫不逊色的I/O频宽、并行计算与低功率最优化。使用Tensilica独特的自动处理器产生器,每位Tensilica使用者均能快速产生一个专为其特定应用软件最优化、自定版本的Xtensa LX处理器。无论是处理传统SoC嵌入式处理器控制任务,亦或密集计算型数据路径硬件任务,Xtensa LX处理器均为理想选择,是复杂SOC设计新的基本建构区块。

Xtensa LX处理器核心可自由配置、弹性扩充且可自动合成,不同于传统的嵌入式处理器或DSP核心。SoC设计师利用Tensilica技术,能够量身打造适合目标作业的一或多个Xtensa LX处理器。设计师选择与配置预先定义的处理器属性,并使用Tensilica Instruction Extension(TIE)提供的方法,加入执行数据路径、I/O连接端口和缓存器的类Verilog式描述,提供可与自定逻辑设计相媲美的效能、面积和功率特性。或者,设计师可以使用XPRES编译器分析C算法,并自动建议组态选项和延伸,以更快的速度执行大量的算法命令。

这款Xtensa LX处理器日前甫在嵌入式微处理器效能指针联盟(Embedded Microprocessor Benchmark Consortium,EEMBC)的Networking 2.0与Office Automation评比项目中,写下有史以来最高的效能成绩,超过任何其它处理器所发表的数据。EEMBC负责发展与认证模拟实际环境的效能量测指标与数据,协助研发业者为其系统选择适合的嵌入型处理器。每款送交至EEMBC进行量测的处理器,都会测试各种代表不同作业负荷的参数,以及在通信、网络、消费性、办公室自动化、汽车/工业、嵌入型Java、微控制器相关应用方面的组态。
EEMBC的成员包括各大半导体厂商、智产业者、以及编译程序厂商,不仅树立效能量测指标的业界标准,亦透过EEMBC认证实验室(ECL)提供效能量测指标结果的认证服务。

针对可授权、可合成处理器所开发的EEMBC,其数据以 “每MHz”为单位基础。在Office Automation量测项目中的最佳化组态Xtensa LX,采用90纳米特殊应用IC技术,达到454 MHz的运作时脉。最佳化版本的Xtensa LX比体积大出许多的未经优化之C-Code PowerPC 440 GX快将近4倍,且比未经最佳化之C-Code 64位MIPS 20Kc处理器快4倍以上。除了在OAmark创下大幅领先的佳绩外,Tensilica的Xtensa LX处理器还提供大幅缩减的程序代码,使用内存的容量亦大幅缩小。

在辅助工具方面,Tensilica XPRES(XtensaR PRocessor Extension Synthesis)编译器是一个功能强大的合成工具,能够从原本C/C++程序代码建立Xtensa LX处理器的自订指令集描述。搭配Tensilica的Xtensa处理器之产生器技术,算法与系统设计师可利用XPRES编译器,直接从C/C++参考程序代码合成高度最佳化的处理器之硬件缓存器转移层级(RTL)源码。
  
<b>结语</b>
现今微处理器的设计有两种方式:一是借力使力,开发与既有微处理器兼容的产品;一是无中生有,开发具有完全自主知识产权的微处理器。前者虽具应用工程师对其体系架构有较多了解、便于推广应用;且操作系统、程序编译、仿真器和调校辅助工具等平台开发资源丰富,可支持的应用软件亦较广等诸多好处,但此一无法掌握关键技术的快餐型做法,却是有识之士的隐忧。而后者从基本机构开始布建的扎实型方式,则需克服“指令集” 完备与否的难题,且在软件上也要自行开发编译器以及周边连接工具和调校等辅助工具。

今天的电子市场仍需要更短的产品开发时间,使用可靠的IP以节省时间,减少开发人员的数量,延长产品的市场寿命。自Intel于70年代推出四位机4004后,近年来国外大厂在微处理器设计上屡创佳绩;反观国内微处理器产业,由于人才、技术及资金相对缺乏,似乎一直难以寻求指标性的突破。于是,意外刺激了嵌入式系统包套交易的活络,也造就了所谓IC设计服务产业的兴起。