RLDRAM-II在高速网络应用之优势

本文作者:admin       点击: 2003-06-01 00:00
前言:
RLDRAM II(Reduced Latency DRAM II)一个是由英飞凌科技(Infineon Technologies AG)与美光科技(Micron technology)连手推出的高速低延迟(Reduced Latency)DRAM 架构,是第二代、超高速DDR SDRAM的产品,其传输速度可高达400MHz,并且是一个能够有效地结合超宽频及高密度的快速随机存取需求为主的完整规格。
为了进一步地让读者对于RLRDRAM-II有更清楚的认识,本文将详细说明RLDRAM-II在网络应用的优势、功能与运作方式,并将介绍RLDRAM-II与Network FCRAM-II的差异之处。

现行网络应用之运作方式所面临的瓶颈与问题
OC-192 与OC-768规格的网络速率、内存存取与密度,已成为主要瓶颈所在,特别是用在具处理器架构的网络线路卡上的内容可寻址内存(Content Addressable Memory,CAM)与封包缓冲SRAM等芯片。
研究指出,若采IPv.4规格1,至少需要内存容量达150M 位的CAM,才能妥善处理1024K的因特网协议(IP)标头码(代表地址所在)。如果以相同数量的IP标头码,到了IPv.6规格,内存容量就需大幅扩增到2400M 位的三元(Ternary) CAM。内存容量与尺寸还不是唯一的问题所在,快速执行搜寻的能力也是另一个考量的重点。
封包缓冲存储器可以储存现有的封包,直到网络处理器找到正确的地址;而设计封包缓冲存储器的一项主要考量,在于能够快速储存或释放大量信息的能力。尽管SRAM是此类缓冲储存应用中最快速内存芯片,但SRAM储存每一位元信息,需要使用六个高漏电的晶体管,而导致低内存密度,同时还要付出高耗电量的代价。
不同于SRAM,CMOS DRAM储存每一位信息,仅仅使用单一晶体管,若以内存密度与耗电量的角度来考量,CMOS DRAM堪称是最具效率的装置。

RLDRAM-II可改善现有瓶颈
通常每一个CAM可储存约9M 位的信息量,SRAM则可储存约16M 位 的信息量。RLDRAM-II却可储存高达288M 位的信息量。若改用RLDRAM-II架构,网络系统工程师可储存的信息量,比传统CAM架构之系统所存的多了128倍。因此,RLDRAM-II可节省珍贵的基板空间,不必为了容纳CAM与 SRAM的需求而采用多板设计。
改采DRAM设计不仅可节省空间,还可大幅节省电源。单一RLDRAM-II所能储存的信息量,必须要有数颗CAM/SRAM才能达到。SRAM需要六颗晶体管,以储存一位的信息,CAM也至少需要12颗晶体管之多。RLDRAM-II却只需要一颗晶体管,耗电量可明显地大幅降低。
    取代存取较快速的内存技术,如CAM 或 SRAM等,以DRAM技术为基础的RLDRAM-II并未牺牲内存存取频宽,RLDRAM-II每个pin脚可提供高达每秒800 M 位的存取速率。

RLDRAM-II的优势
RLDRAM-II采用先进的DRAM架构,特别是针对低延迟率的设计。标准型DRAM的架构为4记忆库(bank),RLDRAM-II则为8 bank。此架构允许较短的行/列地址与数据电路,使存取速率更快。此外,更多bank架构的设计可减少随机存取冲突的发生机率。
数据进出RLDRAM-II的最佳化方式,是以循环式排程法(round-robin),于8个bank内,储存或读取数据。换言之,一个封包所包含的数据,先以一次18或36位(根据所挑选的RLDRAM-II构造)的方式,存入第一个bank中,接着该封包的下一段资料,再以18或36位元的方式存入第二个bank。持续此一方式,轮完八个bank的循环后,再轮回第一个bank进行数据储存。读取数据也采同样的循环方式,数据自第一个bank中读出,接着第二、第三...。当轮完八个bank的循环后,再轮回第一个bank进行数据读取。
除了循环式的读、写数据特色之外,RLDRAM-II的设计也允许用户无须从Bank 0开始,即可自任何一个bank起动此循环运作。因为四个bank的DRAM架构无法支持循环式排程法因此,其并不是采用相同的运作模式。
降低延迟率的效果,自第一个数据封包的资料从第一个bank读出后就立即可以感受到。当第一个bank的数据读出后,下一个时脉则进行第二个bank的数据读取,然后再下一个。读取第一个bank数据的初始延迟率至少约需四个时脉周期来启动此一运作,但完成此运作后,自RLDRAM-II读取数据的速率,就可与所应用的时脉同步。不论读或写模式,RLDRAM-II均具有2、4或8位的爆冲长度(burst length)。
    RLDRAM-II的另一项特色为随机存取的列周期(row-cycle)时间较短,约20ns (奈秒)。RLDRAM-II提供的随机读写一次所需时间(tRC),为所有DRAM芯片中最快速者之一。图1与图2分别显示RLDRAM-II以2位的爆冲长度,在不同读取延迟率下的读写时序。
NETWORK FCRAM-II芯片
Network FCRAM-II2为网络内存应用的强势产品,该技术由富士通微电子(Fujitsu Microelectronics)首先提出,主要是应用在掌上型行动装置上,以取代SRAM的低攻耗内存产品,随后也在网络系统上找到其应用切入点。
值得注意的是,第二代FCRAM被称为为Network FCRAM-II(或称为“NetDRAM”),可在网络线路卡产品上作为封包缓冲存储器之用;而这款产品在SRAM所具有效能优势与与DRAM所具备的高内存密度、低耗能与低成本等优势之间,取得绝佳的平衡。 
从架构到核心设计,NETWORK FCRAM-II有数处与标准型DDR DRAM不同。Network FCRAM-II的架构完全为管线排列,且两两相依,此设计为标准型DDR DRAM所没有的特别功能,诸如列地址选定(RAS)与行地址选定(CAS)控制,以及内部的自动预充电周期。
另外,NETWORK FCRAM-II的核心高度区段化,此设计可让记忆格(cell)更靠近芯片的接口,以提升存取速率。传统的DRAM是以长的行与列来涵盖整体记忆库(bank)。而在NETWORK FCRAM-II区段化的核心中,一个记忆库内的每一区段,存取接口的时间较短。此特殊的区段化核心设计,配合高速感测放大器,将NETWORK FCRAM-II的列周期时间降至20ns(奈秒),与RLDRAM-II的列周期时间相似。
Network FCRAM-II还拥有启动单一bank中一小部份逻辑线(word line)的功能,以节省电源。此设计迥异于一般标准型DDR DRAM,其设计为如果要将一位信息写入bank,必须启动该bank整个逻辑线。Network FCRAM-II区段化的核心设计,造就此逻辑线局部启动的功能,启动一小段逻辑线,以寻址特定范围的区段核心。此方式让bank内相关于该次工作所需的特定范围才会被启动,其它部份则保持在预充电模式下。

RLDRAM-II 与 NETWORK FCRAM-II的差异性
RLDRAM-II 与 NETWORK FCRAM-II有几项实质上的差异,其中主要的不同点之一在于RLDRAM-II是8bank设计的DRAM,Network FCRAM-II仅为4 bank,并且不支持循环式排程法。
为求达到20 ns列周期的表现,Network FCRAM-II采用高区段化的核心,配合特制的感测放大器来达成此一目标。反观8 bank设计的RLDRAM-II,以传统的标准型DRAM的感测放大器,则可达到20 ns的列周期。标准型DRAM的感测放大器备应用于RLDRAM-II时,并没有改变其高产能的特性,将不会影响整体品质与稳定性。因此,所有RLDRAM-II速率等级的产品,均可达到20 ns列周期。
另一项主要不同点在于,类似大部份SRAM的架构,RLDRAM-II可在非多任务寻址总线模式(non-multiplexed address bus code)下运作,。Network FCRAM-II采多任务(multiplexed)寻址总线,此设计不仅带来处理多任务总线的复杂度(SRAM则无此缺点),同时也降低了Network FCRAM-II所能达到的极速与效能。
此外,Network FCRAM-II的多任务总线未能达到100%的地址控制效率,然而RLDRAM-II却可做到。Network FCRAM-II的数据总线需要与位址总线分用时间,因此效率降低至50%。RLDRAM-II地址线与数据线各有专用的pin脚,因此没有分时执行的问题。并且,由于专属的地址线与数据线设计,不需要有低位址锁定(Lower Address Latch)控制指令,所以RLDRAM-II的控制指令较Network FCRAM-II简易。

为求在更快速率下达到更好的讯号完整性,RLDRAM-II的on-die termination (ODT)技术,且输出驱动器的阻抗等级设计为可调整,等级区间为25到60 ohms。此一强化的I/O接口功能,提供更具弹性的基板电路设计,并能达到高速传递讯号的目标。其它弹性的设计还包括设计者可以选择1.5v或1.8v的 I/O电压,以期最能符合界面的电能。RLDRAM-II同样采取每18位电路为写入时脉(write clock)的设计。
RLDRAM-II可同时支持类似SRAM的非多任务寻址设计,以及传统DRAM的多任务寻址模式。用户可自行选择。偏好类似DRAM运作模式与较少讯号数的用户,在RLDRAM-II上仍可选用多任务寻址模式。此外,为了增进系统效能,RLDRAM-II也提供构造为x18与x9的分离式I/O版本(在分离式I/O装置中,运作方式类似QDR SRAM,其读、写总线各自分离,因此不必烦恼争抢总线资源的问题)。
藉由导入不同的输入时脉与读写闪控(strobes),能够进一步强化RLDRAM-II的效能,其中内建的动态连结程序库(DLL),可确保时脉线形可与数据及读写strobes达成一致。
RLDRAM-II在许多领域都有领先的技术展现,包括400MHz的高运作时脉(Network FCRAM-II仅为333MHz)、高效能的I/O功能设计(如ODT技术、可调整式的输出驱动器强度与输出阻抗对应),以及正确的数据讯号。这些功能让RLDRAM-II可达到快速的内存存取,以及较高的有效频宽运作。
以RLDRAM-II来进行网络产品设计,将会较288M-bit 的Network FCRAM-II更具弹性,其主要原因有二:第一,RLDRAM-II的分离式I/O的产品版本,可取代或补足QDR SRAM的需求。第二,RLDRAM-II具备非多任务或多任务数据/总线两种选择。用户可自由选择类似SRAM的非多任务模式,或类似传统DRAM的多任务模式。反观在所有Network FCRAM-II产品版本中,均为多任务模式、4bank设计且不支持JTAG技术规格。再次强调,Network FCRAM-II不像RLDRAM-II兼有多任务模式与非多任务模式、8Bank设计且支持JTAG技术规格的特色。
其它关于Network FCRAM-II与RLDRAM-II的基本差异,详见表1的比较。
结语
综合效能、高密度、低耗电量、小体积及低成本等优势,RLDRAM产品家族可望取代SRAM与CAM于网络设备上的应用。RLDRAM-II于开发时即以网络应用为考量的需求,不像FCRAM或其它DRAM仅是提供修改过内存的产品来因应网络需求,而其原始开发目标只是针对行动掌上型装置或个人计算机。RLDRAM-II的特色,包括高工作时脉、8bank循环式排程法架构、弹性化的I/O构造,以及前文所提的各项功能,促使RLDRAM-II成为超级强力的内存产品。因此,RLDRAM-II在网络应用上,有能力超越Network FCRAM-II与其它标准型DRAM。