如果您对“可编程器件”供应商的印象仅止于那个黑黑的小方块,那可就太狭隘啦!严格来说,所谓的“可编程解决方案供应商”的业务范围,除了PLD或FPGA芯片本身,还包括知识产权和开发软件。翻开一部Programmable Devices的发展历史,有一个名字实不容略过:Altera,它正是可编程器件的供应商鼻祖。有些人可能不知道,这个命名正是取义自“Alterable”(可改变的、可修改的)而来──“我们提供的是一张白纸、一枝笔,和一个图库”,Altera如此定义其根本经营理念。
对于便携式应用,Altera则以5P──Price、Performance、Package、Power和Product价值观贯穿。其中,功耗大、逻辑单元的极限,恐怕是业界对可编辑器件最大的诟病和质疑。对此,Altera认为:“动态功耗”更显重要,且一味追求LE数目并没有意义,因为这将导致不经济。这家创立于1983年、2005年销售额达到11.23亿美元、在全球拥有1.4万多个客户的公司将其成功基础归功于“听取客户的声音”,而毛利润率达68%的优异表现,也的确没令人失望。
Altera的可编程解决方案范围贯穿低端到高端的市场,各有对应;供创作的核心“图纸”有:MAXII用以支应低端的CPLD市场,CycloneII则是FPGA的入门产品,以低成本为诉求。在高密度、高性能的FPGA复杂应用方面,即非StratixII家族莫属,其扩展性的StratixGXII系列更带有收发器,不失为通信领域的理想器件。
CPLD为起点FPGA续煌,
结构化ASIC立标竿
Altera兼具市场和工程经验的王冬刚表示,作为业界第一个提供CPLD器件的厂家,“MAXII新颖的逻辑结构让它得以成为有史以来成本最低的CPLD;而其非易失性、瞬时接通、支持3.3V/ 2.5V/ 1.8V超低供电电压的特性,都为它扩展了市场领域”。据悉,现今全球有Altera的CPLD市场占有率达全球第一,达40%。
把焦点再移至“能者多劳”的FPGA上,基于SRAM架构,拥有180K逻辑单元、350万ASIC逻辑门的Stratix II,是目前业界容量最大、速度最快的FPGA(存储器内核频率可达550MHz),内嵌450MHz的DSP是其特色,一扫低端FPGA只有并行处理的弱点,可在一个时钟周期内迅速完成乘加处理。该款器件更因能与HardCopy的管脚兼容,可将FPGA无缝移植到结构化ASIC,方便设计人员在prototype之后,直接投入小量试产。而系出同门、90nm低功耗Stratix II GX支持嵌入式串行收发器,20个收发器的工作频率在622Mbps~6.375Gbps之间,可力保信号的完整性。另值得一提的是,Altera还拥有一度引发质疑的结构化ASIC──HardCopyII,成为少数屹立至今,甚至越战越勇、渐入佳境的Structured ASIC供应商。再谈谈Cyclone II,最低成本的FPGA,广泛应用于消费类电子,单片成本价可低至3.5美元;即便如此,它依然拥有68K的逻辑单元、相当于700K ASIC逻辑门,以及250MHz的DSP,内嵌单价只有35美分、性能可达100DMIPS的Nios II软核,最具震撼力的是应用于讲求合成变化的新型电子琴,可谓是相得益彰。
HardCopyII的ASIC逻辑门在100万门上下,系统性能在350MHz左右,比起StratixII FPGA原型内核,功耗降低50%以上。关于结构化ASIC的特性,我们之前已有诸多讨论,在此不多做赘述(请参照COMPOTECH 5月刊《编者观察──结构化ASIC是否有其存在价值》一文)。姑且对这种改良式器件的好处做个小结:套用王冬刚现场的说法是,Altera是惟一一家FPGA和结构化ASIC Hardcopy II的供应商,这样意味着可以用FPGA做原型验证,无风险低成本无缝移植到结构化ASIC Hardcopy II,只要把“网表”(netlist)交给制造方,仅需6个月便能一圆从设计创意到产品上市的梦想。“由于这些特性能满足不同顾客的创新需求,HardCopy甚至已成为ASSP标准设计方法的一部分”,王冬刚略显兴奋地指出。
这种增加冗余列的方式,探知坏点时可加以激活,这对产品早期测试助益大,从而使每年每个LE的成本可降低约25%。尤其令人心动的诱因是:1.前述提到的FPGA (StratixII)到结构化ASIC (HardCopy II)的“无缝移植”,只需5-7周便可完成,且不须对ASIC重新验证。2.一旦编程完毕,由于Altera本身和全球代工龙头TSMC(台积电)拥有良好的合作关系,可免去找代工及独力与之协商的麻烦,特别适合原本深受灵活性困扰的ASIC厂商,以及新创设计公司;只要把网表文件档交给Altera代劳并支付少量的Engineering Cost(此费用由晶圆代工厂收取),代工厂的HardCopy II设计中心,便能代为打点一切。Altera特地做了补充。
在必要的辅助──“画笔”和“图库”方面,Altera备有丰富的设计软件、知识产权,着眼于系统集成的SOPC Builder和设计DSP的DSP Builder等支持工具,以及可立马实作的开发板;其著名的32位Nios II软核,将固化的最大灵活度留给客户。简言之,Altera全面的硬件协议IP、MegaCore功能和参考设计,有利信号完整性建模;而诸如PCI Express和SDI等协议的专用开发板和评估板,为FPGA、CPLD和结构化ASIC提供一条龙式的设计流程的Quartus II集成开发环境,则提供从设计输入到器件编程的全部功能,可以产生并识别EDIF网表文件、VHDL网表文件和Verilog HDL网表文件,为其它EDA工具提供了方便的接口,也可以在Quartus II集成环境中自动运行其它EDA工具。加上兼容性测试、系统验证和特征报告,都大幅便利了设计工作的实现。
汽车和通信领域贡献良多
在较长的ASIC或ASSP开发周期限制了对市场竞争的响应,以及利润大幅下降的交相煎熬下,已然构成了数字化的两难境地。在这样一个新的竞争环境中,惟有快速而持续的创新能力,才是能否恒久存续的决定性指标。有鉴于此,Altera也以“平台”产品迎接这些挑战,赋予客户更高的资源利用率,在近来火爆至极的汽车和通信应用也不例外。
作为人们最奢侈的消费品之一,车厂必须在有限的设计周期内,不断推陈出新多种型号的汽车;而随着数字电子的势力进驻车体,制造商似乎更倾向选用富灵活性的元器件来锻铸,以便迎合不断变化消费需求和规章制度,也有助于产品和服务的分化。必要时,还能根据需要修改功能。此时,选用平台化的可编程产品有以下好处:方便在一个基本设计中实现不同的汽车型号,且能为OEM提供更迅速的原型演示设计和销售概念,更重要的是,可将音频、视频和数据融合到一个系统中。Altera在汽车领域的关键平台有四大元素:导航和后座娱乐(RSE)等对“图形”有高度依赖的应用、与车内互联网密不可分的网关、音频处理,以及辅助驾驶系统。
“通信”一直是Altera历年营收中的主要来源,份额逾50%,在固网和无线都有所着墨。凭着多年能征惯战的实务经验,Altera高级现场技术支持工程师花小勇首先表达他对固网的看法:以太网的集中和城域的拓展,以及传送智能数据包功能的加入,使网络发展得以支持更多服务、竞争也日趋白热化。利用“增值服务”来提高运营商的收益,从而增强生存能力,几乎已是不争的共识;然而数据放在公网上传输,难免会出现延迟和误码等问题,故必须从接入、传输、联网和企业端等四大区块根本落实。
以接入为例,过去数据包处理,不是用RISC微处理器架构的NPU,就是用订制的ASSP来做。但前者软件开发难度大、不容易实施,且常发生任务划分问题,且实施成本高,往后要更新的代价也大;后者由于软件引擎集成能力有限,欠缺灵活性,加之所采用的函数常限制了其适用范围,且因为外部加速需要采用昂贵的解决方案,“几乎”无法更新。出于投资报酬率(ROI)的考虑,花小勇认为设计应该能满足多种需求,此时,作为全功能接入数据包处理方案IP供应商的Altera,其CycloneII EPC2C35可为的理想目标器件。
在无线方面,一张RF卡,也可以是FPGA完美的展现舞台;Altera的DSP Builder设计流程可协助实现多个关键功能:
● 数字上变频(DUC):由于FPGA的输入数据格式可定制多信道逻辑,可让设备厂商依需要定制前端;且备有FIR(基频滤波器)编译器IP和NCO(数字控制振荡器)编译器IP,以提供多种标准的最佳FIR滤波器体系结构和多载波的最佳NCO体系结构,以提升码片速率。
● 数字下变频(DDC):在窄波生成解调后,有一抽取滤波器加以把关;应欠采样IF(中频)技术所需,DSP Builder二次采样模块适用于软件无线电定义,抽样转换率在0.5~1之间。其参考设计可以用于8载波UMTS系统,并有SSG(综合时序分析方案)的定制开发。
● 数字上变频(CFR):电路中若峰均值过大,表示偏置电流大,有浪费功耗的倾向;为降低峰均比,此部分同样有使用DSP Builder(MATLAB环境)的SSG(综合时序分析方案)的定制开发,目前已完成4通道的CDMA2000和WCDMA的定制版,同时亦积极和大学等第三方合作更多的变频方案。
FPGA对于基站最大的贡献是,在引入这种可编程的方案之前,模数转换器是直接和基带处理器连接的,经过中间转换、滤波过程后,容易会有失真及功耗不经济的问题;有了FPGA的相助,可对数字失真现象预作补偿,以维持其线性转换比例。以基频滤波器为例,内建系数发生器的FPGA可权充高性能FIR滤波器合成器,以全并行或串行算法体系结构以使性能/逻辑资源达到均衡,且可以使用任意的抽头数。此外,FPGA还具有可使用多系数调整算法,能从第三方工具中导入系数或让用户自行建立,以及提供浮点至定点系数分析的特性,而Altera的Cyclone II和Stratix II,正能满足这部分的需求。值得注意的是,这两款产品已包括脉冲、阶跃函数和随机输入测试功能,可免去用户自行编写测试向量的麻烦。
视频和图像处理增光添彩
在消费者对数字内容有着越来越高的期待,以及政府改造要求的双重激励下,视频和图像处理必须拥有更高的采集和显示分辨率,对高级系统智能的需求也更高,就连压缩技术的发展也一日千里;新压缩算法的出现,提高了视频质量,也节省了存储的空间。Altera现场技术应用经理蒋治表示,这些,都迫使广播编码、视频监控和医疗成像发生了微妙的变化。此时,FPGA与多个DSP或ASSP相比,更具有降低成本、缩减电路板面积等好处,也是其价值所在。Altera也适时推出相应的处理套件,对去隔行、色彩空间转换、影像缩放、Gamma校正、Alpha混合、Chroma二次采样、2D滤波器、2D中值滤波和线性缓冲编译器等9个常用的视频和图像处理功能库进行优化。其中于今年5月间所推出的VIP库套件,更包含了丰富的知识产权内核。
视频及图像的另一热门应用是监控DVR市场,由于公共安全意识的增强,并纵向延伸至银行、零售和道路等领域,加上早期模拟系统朝数字化的改朝换代,AP制造商所扮演的角色也更为举足轻重,必须以更低的价格以搏取更大的市场份额,在研发上的投入也更大。因此,采用IP的系统是发展趋势,进一步改进了智能图像分析和精确视频移动探测算法,网络DVR、基于IP的摄像机和IP视频服务器等着重分布式采集和集中存储的设备也大行其道。Altera在视频QUAD/MUX控制器、压缩技术、PCI & PCI Express,以及IDE/SATA/I2C/I2S等DVR系统中的关键模块,也有相应产品的推出。
为什么低成本视频压缩系统要采用FPGA来实现?Altera指出,以FPGA实现的可编程系统价格在10美元~25美元之间(当然,部分高端系统不在此列),且相对于ASIC和ASSP,具有更佳的灵活性和更新能力另与制式处理器相比,除了同样在系统成本和外围元器件较具优势外,更能大大提高性能并方便新功能的增加。
结语
可编程器件最早为人所注意,无疑还是因为它的“灵活性”。首先,在设计过程中,问题总是无可避免,但如何提高解决问题的效率显然更重要;以90nm工艺平均一张100万美元的掩膜成本,通常一张电路板有9~12层来计算,这当中所撙节下来的“NRE重工”成本,便已逼近千万美元!尔后,在规格/市场多变、产品生命周期越见短促的情况下,这种以易于修改见长的器件,再度掳获用户芳心。
细剖Altera的成功之道,除了得益于产品本身的优势外,“优异的运营,是我们能提供客户的另一项有力保证”,王冬刚不忘提起。“这意味着,我们能按计划引入新产品,一且可以量产,便能迅速提高产量;且即使在需求非常大时,我们也能坚持做到按时交付。再者,我们的赔付比例一向极少,也说明了我们的质量是受肯定的”,他说。当然,细究当中至要成因,很大程度拜其获得专利的冗余技术所赐;这种“利用冗余补缺陷”的做法,加上单一代工线与多种制造工艺策略的协调,以及集成供应链管理,能从早期就保证产量及良率;由于与TSMC排他性的合作,可确保工艺的一致性,据称能将良率提高7倍以上。此一可编程器件的先驱,未来又有怎样出奇制胜的举措及成果?且拭目以待。