随着网络的普及,业界甚至乐观的预期,VoIP终将完全取代传统电话服务(Plain Old Telephone Service, POTS)。由现在这个时间点往回看,2001年的网络泡沫依然令人心惊,而POTS的市场虽然逐渐萎缩,然而取而代之的却未必是VoIP技术,手机成为手持通话方式的更强劲对手,VoIP取代所有手持通话市场的美梦,也许只是网络泡沫的其中之一。
VoIP逐渐从光芒万丈的第一线,慢慢淡出到平实的第二线。随着芯片的计算能力突飞猛进,VoIP渐渐成为一种通信的基础技术,你总是可以在各种不同的通信方法中看到它的实作──或是影子。
VoIP是Voice over Internet Protocol的缩写,这是一种透过因特网或其他使用IP技术的网络,来实现新型的电话通信方法。VoIP的前身可以追溯到1973年,在ARPANET上的网络语音协议(Network Voice Protocol, NVP)。之后,随着网络的普及,业界甚至乐观的预期,VoIP终将完全取代传统电话服务(Plain Old Telephone Service, POTS)。由现在这个时间点往回看,2001年的网络泡沫依然令人心惊,而POTS的市场虽然逐渐萎缩,然而取而代之的却未必是VoIP技术,手机成为手持通话方式的更强劲对手,VoIP取代所有手持通话市场的美梦,也许只是网络泡沫的其中之一。
直观来看,VoIP是POTS在因特网上的型式移植。一般的家用电话,将语音由发出端送到接收端的过程如下:
● 声电转换:通过压电陶瓷、碳粉等原理做成的拾音器,将声波变换为电气信号;
● 传输:电气信号藉由电信业者所架设的公用电话交换网络(Public Switched Telephone Network, PSTN),到达对方的话机;
● 电声转换:通过线圈纸盆等原理做成的扬声器,将电气信号变换为声波。
在PSTN中,其实也藉由传送固定频率声波的方式,传送及接收少量的数据,如电话号码、状态音…等。
而VoIP将语音由发出端送到接收端的过程,由于改由因特网传输,因此在传输的步骤必须做较多的工作如下:
● 声电转换:与家用电话一样;
● 量化取样:由声波变换而来的电气信号是模拟信号。将模拟信号运用模拟/数字转换(A/D Convert)的方式取样,并遵循某种采样方法(例如脉冲编码调变,即PCM)转换成数字信号;
● 封包:将一定时间长度的数字语音信号组合为一帧,然后,按照该VoIP架构所使用的协议,依OSI模型加上各层的表头和结尾,成为一个完整的封包;
● 传输:封包藉由因特网进行分组交换,而传到对方的话机;
● 封包调整:由于在网络传输的过程中,封包未必会依发出的顺序到达,也未必会在可接受的时间前到达,因此,将封包暂存、排序,并使用一些算法的技巧来补缀漏掉的封包,便成为VoIP的关键技术,通常在网络电话或VoIP网关中会有高效能的语音引擎来处理这个繁重的任务。语音引擎的能力越强,用户听到的语音越接近真实的语音,听不出延迟(Latency)与抖动(Jitter),对网络带宽的要求也越低;
● 解封包:按照该VoIP架构所使用的协议,依OSI模型将各层的表头和结尾剥除,成为一定时间长度的数字语音信号;
● 电声转换:与家用电话一样。
语音编码方法攸关语音质量及使用带宽,而两者往往互相矛盾。由于对两者的取舍有别,而且算法的影响极大,因此编码方案五花八门,其中包括国际电信联盟的G.711(速率64kbps),G.723.1(速率5.3kbps或者6.3kbps),G.729A(速率8kbps)编码方案。微软、Intel、Skype等业界巨头也有自己的编码方案。不幸的是,使用不同编码方法的话机不能互通,算法又常常因为专利的问题而另行收费,对网络电话的互通造成很大的影响。
常用的VoIP网络协议
用于VoIP的网络协议,目前常用的则有H.323、SIP、Megaco和MGCP。
H.323是由ITU-T于1996年提出,原本是用于局域网络(LAN)上的视频会议,后来被应用于VoIP网络电话上。H.323定义了一个综合性的规范,使网络上的终端设备遵循这些规范,得以顺利进行沟通,包括语音压缩格式(G.711、G.729、G.723.1)、影像压缩格式( H.261、H.263 )、呼叫(H.225)、控制(H.245)、注册与认证等。H.323架构由4个组件所组成,包括终端设备(Terminal)、网关(Gateway)、网关守卫(Gatekeeper)、多点控制单元(MCU:Multipoint Control Unit),可进行单点对单点或单点对多点的通信。
对于VoIP的应用而言,H.323的子协议多且复杂性高,在许多技术上的问题受限,不容易针对新的应用作扩展。因此,IETF(Internet Engineering Task Force)分别在1999年8月提出MGCP(Media Gateway Control Protocol)协议,1999年3月提出SIP(Session Initiation Protocol)协议,试图简化H.323的复杂性,且在语音传递功能提供较高的延展性。
SIP是一种应用层控制协议,用于和一个或多个参与者建立、修改和终止会话。 SIP 的结构与 HTTP相似,客户机发出请求,并发送给服务器,服务器处理这些请求后给客户机回送一个响应。请求与响应形成一次交换(transaction)。
MGCP是由Cisco和Telcordia提议的VoIP协议,它定义了呼叫控制单元(呼叫代理或媒体网关)与电话网关之间的通信服务。MGCP属于控制协议,允许中心控制面板监测IP电话和网关事件,并通知它们发送内容至指定地址。在MGCP结构中,智能呼叫控制置于网关外部并由呼叫控制单元(呼叫代理)来处理。同时呼叫控制单元互相保持同步,发送一致的命令给网关。
Megaco(又为H.248)是一种控制协议,用来在网络上做媒体网关与媒体网关控制器之间的控制。 Megaco/H.248定义媒体网关控制器所用的控制机制,以控制网关特别可以支持网络上的多媒体信息流。从 VoIP 结构和网关控制的关系来看, Megaco/H.248 与 MGCP 在本质上相当相似,但是 Megaco/H.248 支持更广泛的网络媒介,如 ATM 。
同样不幸的是,使用不同VoIP协议的话机也不能互通,更甚之,由于有些协议(如SIP)并不是硬梆梆的规格,而有“协议”的性质,细节的实作也往往因厂商而有不同,使网络电话的互通更加困难。
节费为主要应用诱因
在VoIP电话兴起的年代,推广者的诉求重点中一定会提到“节费”二字,这在当时是非常吸引人的诉求。然而回首往事,这个诉求恰恰是VoIP取代所有手持通话市场的最大障碍。原来世界各国的电信事业,不是国有企业、特许行业,就是托拉斯级的巨兽型企业,在这些企业花费巨资,布建了广大的PSTN网之后,突然有新的技术以“节费”为诉求,居然可以坐享其成(不要忘了,网络的最后一哩常常也是借道PSTN),电信业者情何以堪?因此,VoIP电话在各国,除了日本勉强可以推动050网络电话之外,其他国家都受到技术性的阻挠,如无法监听、无法紧急拨号…等。因此,网络电话总是无法成为主要的手持通话装置。
在网络泡沫化之后,VoIP的话题沈寂了一段时间,直到2003年,Skype的问世,吸引了众人的目光。清晰的语音与囊括所有网络电话优点的使用界面,使Skype一夕之间成为网络电话的代名词,使用VoIP技术通话的人口也因此激增。然而,对于手持式VoIP电话系统而言,这显然是重重一击,因为类似Skype这类实时通信软件不需太多额外成本,不像手持式VoIP电话需另行购置话机,VoIP取代所有手持通话市场的可能性更加降低。
跨国企业成为主要客群
尽管如此,由于全球化的影响,跨国企业越来越多。分布在世界各地的企业分部及工厂需要有更经济实用的电话系统,对于同时有能力提供语音交换及网络装置建置的厂商,如Cisco、Avaya、Nortel…等,则是一大商机。建构良好的VoIP系统,不但能共享传送数据流的网络连接,而且使用方便,甚至使用公司内部分机号码就可以和远在他国的单位通话。
同时,经过这么多年的技术发展,VoIP交换技术也很成熟。因此,有些以往费用较昂贵的长途电话及国际电话,也有不少例子是除了原来的卫星联机、海底电缆连接外,也提供以VoIP为媒介的联机。有些规模较小的电信业者,也使用VoIP交换技术,以租用短途电话线路(价位较便宜),长途部分则以VoIP做为媒介的方式,既赚取差价,也不会明白得罪主要的电信业者。
目前,VoIP交换技术几乎都掌握在VoIP设备大厂手里,但是一般人所不清楚的是,那些美美的、可靠的话机、高速价昂的VoIP网关…等设备的制造,却有一大部分是由台湾地区的网通大厂,如鸿海、明泰、华硕、纬创、东讯、英保达等代工。
VoIP将无所不在
VoIP逐渐从光芒万丈的第一线,慢慢淡出到平实的第二线,在技术的领域里,历史一再告诉我们,如何能在变动较小的情况下,结合现有势力,是成功的快捷方式之一。处理器是如此,VoIP也是如此。毕竟好的技术总是不寂寞,只不过是“转进”而已。随着芯片的计算能力突飞猛进,VoIP渐渐成为一种通信的基础技术,以后,你总是可以在各种不同的通信方法中看到它的实作──或是影子。
(注:本文图片来源取自网络照片)