亚马逊Echo的巨大成功,让同样在语音交互技术上探索出路的科技界忽然明白了市场的方向。苹果、Goolge、Microsoft等科技巨头纷纷投身到智能音箱市场,因为智能音箱不再是一个孤立的消费产品,而是与千千万万消费者连接的语音交互入口,透过这个入口,大家能做的事情非常非常多。在中国,科技精英们同样意识到了智能音箱潜在的价值,也迅速跟进,与既有的互联网服务相结合,推动技术和市场的发展。
在语音交互产品方面,亚马逊(Amazon)实际晚于苹果,Google和Microsoft。
早在2011年,重病缠身的Jobs坚持完成了对Siri的收购,使得Phone4S手机的语音交互应用成为产品一大亮点,但或许是手机市场实在太好的原因,Apple并未在Siri上下太多功夫,这让Siri一直没有更进一步的表现。Microsoft则是专注于他们的操作系统,在Windows 10上面首次搭载了自家的语音助手-Cortana,与用户进行语音互动,Cortana透过记录用户行为,学习用户习惯,配合搜索引擎回答问题,多媒体点播、读取邮件等等工作,而其实Cortana源自Microsoft游戏Halo系列中的一个人工智能系统,透过语音与人类进行信息交互,虽然她在游戏中的生日是2549年11月7日,但是实际上却是在2001年就出现在游戏中了。和其他人一样,身负Android重任的Google同样将功夫下在移动设备市场,Google Vocie Search仍然是其为其搜索业务拓展市场服务,后发展为Google assistant。
强强联合打造各自生态系统
当业界将语音交互入口统一到智能音箱的时候,这些已经存在的技术,配合各自的产品形成了智能音箱不同的技术阵营,打造各自的生态系统。
Amazon Alexa是与其Echo音箱同期发布的开放平台,于2015年6月echo音箱正式发布后不久,开放给第三方开发者,目前各类项目已经接近4万个,远超其他对手。Amazon Alexa已在全球38个国家开通(中国暂未开通),涵盖英语、德语、法语、意大利语、西班牙语和日语6种语言。除了搭载echo音箱产品,Alexa也能与联想、哈曼卡顿等音箱产品,amazon fire TV 智能电视,amazon fire、HTC等平板电脑、智能手机,笔记本电脑、PC,智能冰箱、智能灯、智能开关等智能家居产品,智能耳机、智能手表等可穿戴设备,以及具备AI功能的宝马、雷克萨斯、丰田等品牌汽车连接,为用户提供语音交互。
图说:Amazon 的Echo Show 和Echo Spot 均以配备屏幕
Microsoft的Cortana在2014年微软开发者大会首次发布,后端使用bing搜索引擎,以Windows 10操作系统为基础,为用户提供语音交互服务,如前面提到的搜索问题,控制智能家居产品,连接自家智能音箱。2017年开放给第三方开发者,目前支持包括中文在内的10来种语言。
Google Assistant是谷歌推出的支持语音交互的虚拟助力服务,2017年发布软件开发工具包,不仅支持语音交互还支持视觉相应,比如透过手机的相机翻译文字或说明。目前已经支持几十种语言,除了可以配合自家的Google Home音箱、Pixel智能手机,还Sony、Panasonic、LG等品牌的家电音箱产品连接,并在部分沃尔沃汽车上尝试提供语音交互服务。
图说:Google Home 智能音箱 图片来源:Google
Apple Siri是苹果自家智能音箱HomePod的基础语音平台,早在2015年,Apple就曾经尝试过与自家的Home Kit智能家居控制系统整合,结果是差强人意,如果不是智能音箱市场的崛起,Siri可能还会停留在仅仅是一个iOS 的App这样的位置。2016年苹果开放了Siri接口,允许开发者在新增的Sirikit协议下调用Siri实现音频交互,目前仅能在苹果旗下各产品中使用。
高通与Line合作的Clova智能云则是另外一种方式的合作,一个是芯片供应商,另一个则是拥有庞大的在线交互用户的即时通信平台,。
在中国市场,由于科大讯飞在中文语音识别技术上的主导作用,一大批智能音箱、智能家居、智能汽车产品与之合作。比如位居中国智能音箱销售前列的-叮咚音箱(京东的智能音箱)就是采用了科大讯飞的语音交互技术。
其他几家中国的顶尖科技公司在智能音箱市场也无一缺席,比如:百度DuerOS-小度,2017年7月面世,依托百度搜索引擎提供多种服务;阿里巴巴的AliGenie语音开发平台配合自家的天猫精灵智能音箱,语音交互技术来自另一家技术供应商思必驰,为用户提供购物、出行、智能家居等各种场景的服务;小米的语音交互平台被命名为小爱同学,自己的智能音箱就叫小爱音箱,语音交互技术同样来自思必驰,最大优势是小米在家电,IoT设备庞大的硬件产品群以及大量的用户,“小爱同学”可以直接与这些设备进行语音互操作,而且小米家硬件产品种类还在不断扩充。
图说: 百度智能音箱2018下半年快速成长小度在家智能视频音箱 图片来源:baidu.com
TI、MTK 占据优势供货商位置
从结构上看,智能音箱与传统音箱的差别除了增加麦克风或者麦克风阵列,最大差异就是后端需要一个小型的计算系统,与云端进行数据交互,如果去掉音频交互硬件部分,这个小型的计算系统与其他的移动设备没有任何区别,需要有CPU、存储、无线通信(蓝牙、WiFi)、电源等等各种模块,而且新一代智能音箱已经配备了屏幕和触控操作功能。
在以智能音箱为主的语音助理设备芯片领域,联发科目前占据绝对优势地位,市场占有率达到 70% 以上。作为排名第一的芯片供应商,MTK为亚马逊 Echo 系列(Echo、Dot、Plus、Spot),Google Home,百度小度在家,阿里天猫精灵,叮咚等主流产品提供解决方案。此外包括Realtek、Marvell、Amlogic、全志、瑞芯微、国芯在内一些移动领域的供应商也在为智能音箱提供产品。
而在音频交互的硬件设备上,无论是亚马逊Echo、Google Home或者叮咚、天猫精灵等产品,ADC,数字音频功率放大器、LED驱动中,都不乏德州仪器各类产品的身影,可说是占据了有利位置。
新一代智能音箱更具交互功能
德州仪器认为:在智能语音助力设备设计制造领域,总体成本、电池续航力、热效应、回升消除和音质方面要更具竞争力才能赢得市场认可。为此,TI在10 W 以下的音频系统,用铁氧体磁珠取代电感器。一个典型系统中的4 个电感器的平均成本为 0.16 美元,而 4 个铁氧体磁珠的平均成本仅为 0.04 美元。仅一项,设计人员就可在一个双声道系统中平均节约 0.12 美元;同时TI从音频放大器左手控制系统功耗,运用混合调制模块音频放大器可调整输出脉冲宽度调制的工作周期,控制从电感器到音箱的电流,从而减少 50% 的闲置电流;在音质方面,透过简单的D类音频放大器系滤除杂讯和背景噪声,改进算法和模型提升音频放大器的输出品质。
图说: 新一代智能音箱系统框图 图片来源:德州仪器
除了高保真的音质,配备电池和屏幕的智能音箱对硬件系统提出了更高的要求,而蓝牙语音交互也即将成为市场标配,这也将增加系统的复杂度和严格控制功耗的需求。
图说:2019 年初即将发布的HomePod 主打音质 图片来源:apple.com