媒体融合凭添信息处理复杂性新一代网络搜索引擎应运而生

本文作者:admin       点击: 2006-08-10 00:00
前言:
对更高带宽、不断出现的新型网络服务的支持,以及数据接入时间缩短和改善安全性的需求正使网络管理日益复杂,这意味着选择正确的网络搜索引擎(NSE)越来越重要。但是,因为设计师正被迫寻找严格的服务水准协议(SLA)来满足网络市场新的需求和客户对高增值服务的需求,目前的网络搜索引擎产品不一定能满足下一代网络的需求。所以为了满足通信设备供应商对性能及易用性的需求,我们需要一种更快、更强大的下一代搜索解决方案,这个解决方案可满足更大量和更复杂的搜索需求。某些应用甚至可能需要超越传统的基于TCAM的网络搜索引擎功能的搜索解决方案。
  
Triple-play
市场面临诸多挑战


服务提供商和企业级客户已经开始强调数据处理管理而非单纯的带宽。他们需要更多的功能和更广泛的功能设置,例如在视频分配更多采用多点传输、基于客户的优先排列进路、虚拟专用网络(VPN)、接入控制列表(ACL),以及改善的服务质量(QoS)控制,而且所有这一切都必须以更低的成本实现。

向新标准转移是设计师面临的又一大挑战。例如,从IPv4到IPv6的过渡势头在稳定增长。这种趋势是由移动性、超载的互联网路由系统、对更高服务质量(QoS)和安全性的需求,以及包括VoIP新服务和用户终端设备(CPE)的增值推动的。分析师预测,IPv4的32位寻址将在2008年失去作用,促使系统开发商纷纷转向大型128位地址空间集成到IPv6。美国政府甚至要求所有的联邦机构在2008年部署IPv6标准。一旦这个过渡开始,系统设计师就要同时支持IPv4和IPv6的流量。

应对这些挑战时,设计师还必须考虑可靠性问题。他们必须满足客户日益复杂的需求,并在不增加功耗和威胁系统稳定性的条件下集成一系列功能。为了满足快速变化的市场需求,他们必须找到一种可为市场带来更具成本效益、高度优化和能缩短开发周期的灵活升级架构的方法。
 
现有可选方案不敷使用

目前,许多解决方案都具有实现信息包搜索的处理能力。这些解决方案包括专用集成电路(ASIC)、现场可编程门阵列(FPGA)和网络处理器单元(NPU)架构。静态随机存取存储器(SRAM)和高速动态随机存取存储器(DRAM)在提供NPU解决方案所需的某些外部存储器以支持各种功能的处理方面发挥了重要作用。这些存储器也可用于ASIC和FPGA解决方案。

当ASIC、FPGA或NPU作为网络架构中主要的数据平面信息包处理器使用时,信息包搜索只是其需要支持的信息包处理的基本成分之一。然而,信息包搜索是计算密集型任务,它需要消耗主要处理元件的信息包处理能力,结果限制了处理其它任务。另外,在面对IPv6更宽的关键字检索时,ASIC、PFGA和NPU将受到进一步的限制,同时外部存储器总线的压力也会加大。

服作为数据平面信息包处理器使用的ASIC、FPGA和基于NPU的解决方案性能缺点的一种方法,就是采用NSE从信息包处理器上卸载搜索功能,并加速信息包转发和分类。它有助于网络设备开发商满足用户所需求的包括严格SLA的执行、区别化QoS、安全数据处理、ACL以及计费等许多的增值服务。
  
NSE走入系统架构  降低处理负荷

实现今天用于信息包处理的ASIC、FPGA和基于NPU的解决方案和加速下一代业务流量的关键是在系统架构中采用NSE。然而,为使NSE可以有效地满足IPv6、10Gbps等不断涌现的新应用的需求,未来一代的网络搜索解决方案必须具备许多独特而创新的功能。这些功能可作为厂商对所有目前和未来的NSE解决方案进行评估的标准,具体包括:

支持快速、全方位、同步搜索
为应对包括加速IPv6处理和实现增值服务等10 Gbps应用的挑战,下一代NSE需要提供更多的搜索性能。今天,搜索协处理器能够加速IPv6并实现高达40 Gbps的信息包处理速度。最多可达4个的同步多数据查找(SMDL)等创新性功能可将性能率提高到每秒10亿次(BSPS)以上。SMDL支持一个周期内的4个同步、互斥和独立的搜索,内核搜索速率为250 MSPS。该内核搜索速率显著高于现有解决方案。多同步查找有助于信息包利用外置搜索总线发送一个关键词,并以平行方式执行多个查找,在增强系统性能的同时减少在搜索总线上多次发送搜索关键词的需要,从而以更高的传输速率将增值服务处理的延迟降到最低。

有效和更宽的IPv6接口
大多数现有的NSE架构采用72位宽的接口,与IPv6信息包内较长的地址而言不是最佳的选择。下一代NSE必须支持更宽的接口——与生俱来的80位搜索宽度配置——加速IPv6信息包相关的关键词的搜索。

为了更好地理解更宽的接口需求,考虑在IPv6报头上的5元组查找(IP协议域、IP源端和目的地址、TCP源端和目的地端口号)需要296位的搜索关键词,使用传统的NSE的72位接口则需要576位的入口。现有的NSE根本不是用于处理296位查找的有效方法。因为72位接口只支持36、72、144、288及576位查找,296位查找无法优化搜索宽度。使用576位入口会增加延迟,降低搜索性能,浪费设备上宝贵的入口存储。

相比之下,80位宽接口的NSE可支持4个80位的320位查找。支持320位宽查找的NSE架构可以为296位的IPv6 5元组查找提供最佳的接口存储宽度。这将大幅度提升系统性能,同时可为入口增加一些附加位,以满足客户超过标准5元组查找的需求。

通过加倍频率和增加需求总线至80位,IPv6信息包分类搜索性能可增加到4倍。

减少软错误的有效方法
当地球大气的中子与电子系统碰撞时就会发生软错误。这些错误会引起系统故障或导致不可预知的问题,高可靠性的网络设备是不能接受这些的。它们不仅影响网络数据的完整性,还会导致网络不能正常运行。由于网络的每分钟中断都会给厂商带来经济上的损失,所以找到一种有效的方法来减少软错误是非常必要的。

不幸的是,由于随下一代网络日渐复杂程度,这种挑战正在不断增加。在城域以太网和服务路由器市场,客户对“5个9”服务的需求最注重的就是网络数据的可靠性和完整性。向深亚微米工艺技术和更低工作电压的转移使问题进一步复杂化。这些下一代工艺提供了更高的芯片密度和更快的片上性能。采用这些工艺制造的IC更容易受到TCAM入口软错误的影响,因此存在严重的可靠性问题。

为解决可靠性的问题、改善数据的完整性和确保符合严格的SLA要求,下一代NSE必须可集成进行检测的错误校正能力(ECC)。这种能力是实时地,可记载并且不需要控制平面干预。在影响功能之前,ECC可自动检查和校正嵌入代码。由于是在背景模式下操作,所以这些对搜索性能没有什么影响。整个阵列都可以在 50 ms内进行净化,包括最近没有存取的接口。在扫描期间所有入口都要检查,以发现“沉默”的故障。早期的单位错误检测可减少不可挽回的错误机率。
  
支持(DDR)等可简化用户时钟调度的接口
选择NSE时,了解解决方案是否有合适的接口很重要。例如DDR,它能简化时钟调度并最大限度地降低器件运行的时钟速率,以获得最高的搜索速率性能。这在选用“2倍时钟”时钟调度时特别重要,这时的输入时钟是以2X搜索速率运行的。因此,要完成每秒1,250万次(MSPS)搜索,该时钟就必须以两倍的250 MHz速率运行。使用一个有DDR接口的NSE就可以用与该时钟输入驱动等效的搜索速率——使250MHz时钟可以提供250MSPS的性能。因此,设计师能够以具有改善的信号完整性和简化终止调度的低成本元件,降低整体设计的成本和复杂性。

自动入口再使用
ASIC设计是一个复杂的任务。ASIC 设计师最不必担心的事情是搜索引擎阵列中未使用或很少使用的入口删除管理。利用NSE直接集成的自动入口再使用功能,旧的入口能够自动做出删除标记,同时可以灵活设置根据老化程度从阵列中清除入口的频率。不必把这个功能设计到ASIC中,可以节约设计师的时间和精力,以及ASIC的处理资源。
  
为应用而优化的搜索解决方案

为满足今天网络设备设计师的需要,下一代NSE必须可提供针对特定客户应用而优化的搜索解决方案。从广义上说,传统上NSE可支持两种类型的查找:策略和转发。策略查找包括用于支持需要通配符搜索的接入控制的列表或QoS。由于其具有三重性,传统的TCAM搜索引擎是执行通配符搜索和策略查找的最佳方案。相比之下,L2-L3转发需要精确匹配和前缀匹配搜索,而不需要基于NSE的TCAM的先进搜索能力。

虽然存在搜索优化的机会,为保证其成功,必须首先解决导致性能退化的不确定性和控制平面软件的复杂性等传统上困扰算法解决方案的问题。算法搜索引擎可以为日益增长的支持转发入口表提供成本和功耗更优化的解决方案。例如,在交换机或路由器应用中,由于转发入口通常占用75%的入口进行查找,通过把这些表从TCAM移动到一个算法解决方案就可以显著地节省成本和功耗。另外,该算法搜索引擎可为精确匹配和最长前缀匹配搜索提供理想的解决方案。幸运的是,算法解决方案的局限性是可以解决的。一旦这些问题得到充分解决,就会出现真正优化的搜索解决方案。然而,为了实现算法的最高价值,算法和基于TCAM的NSE解决方案应该从硬件和软件两方面进行无缝集成。基于TCAM的NSE和算法搜索引擎应该是同一封装、接口和引脚位,而软件开发环境应该高度抽象以简化解决方案的应用。利用一个统一规划模型可以将每种方法的功能差异融为一体,成为以最有效的成本和功耗处理所有的搜索、精确匹配、前缀匹配和通配符匹配的易用解决方案。
  
结语

通信设备制造商继续面对支持包括VoIP、IP电视、计费、统计、安全等在内的融合型网络服务和应用与日俱增的压力。10 Gbps及更高的传输速率,加上IPv6有效地支持更大的地址容量,以及服务提供商及企业客户所需的高系统可用性,信息包处理任务正变得越发复杂和难以解决。L2-L4功能的有效卸载对满足上述市场需求的信息包处理器设计变得越来越关键。这足以在不使用协议处理资源的条件下处理NPU、ASIC和FPGA裕量以实现这些目标。IDT等公司推出的基于TCAM的下一代搜索引擎产品及正确的算法技术将是未来高性能网络应用设计师的主要动力。