网络通讯的跃进、智能装置的普及与 Covid-19 疫情的催化,已然加速「万物联网」时代的来临!然而,当数据量越来越多,自然也面临到带宽、延迟、资安、隐私等考验。为提升传输和处理效率、也为赋予实时洞察力及用户「数字主权」,在众多终端装置与云端平台之间,于本地增设「智慧边缘」(AI Edge) 作为中继站,正在取得使用者与供货商共识。
从城市监控摄影机、工厂生产机台或智能车采集而来的海量数据,若未经预处理或分析就全部上传云端服务器,既浪费网络资源,决策分析也容易有所延误。加入 AI Edge 后,不仅能就近过滤、处理、分析,藉由预设条件先行捞出有用数据、避免「Garbage in, Garbage out」,以提升人工智能/机器学习 (AI/ML) 的效率、效能及可解释性,数据安全和网络安全 (Cybersecurity) 亦可多一层防护。
物联网 (IoT) 相当讲究垂直应用,为因应各式分众市场所需,核心组件的扩展性与安全联机机制已成拼场关键;而去年底刚出炉的 Matter 无线连接协议,因为架构是定义部署在设备和控制器上的应用层,不须依赖任何底层通讯技术便可拥有数字主权与一体成形的安全性的独特优势。因此,虽然是以智慧家庭为起点,有业者更看好 Matter 未来在智慧城市或工业领域的潜力。
工业物联网 (IIoT) 对于资安的要求向来分外严谨,且工厂机台设备往往形式多样,统一联机控管并非易事;Matter 从应用层的制高点切入,除了可望一举突破生态系藩篱,解决原有遗留系统与新购设备不兼容的问题,更期能藉此落实联机身份认证,建立多层防护网。
边缘设备最常见的用途之一是:透过传感器监控环境变量,而位于设备核心的微控制器/微处理器 (MPU/MCU) 功能也越见强大,上至硅智财 (IP)、下至整合模块器件,无不积极抢食边缘运算 (Edge Computing) 大饼,包括新兴的 RISC-V 阵营亦志在必得。在智慧边缘正迈入高速成长期的当口,究竟谁能胜出?强大的智慧运算能力与开发工具包,搭配灵活的可扩展性与资安措施,无疑将是重中之重。
「智慧边缘」生意盎然!可扩展性&资安控管成角力关键
边缘运算 (Edge Computing) 正处于快速上升时期!就连云端服务商都不得不积极抢攻边缘大饼。亚马逊 (Amazon) 公开宣称:前所未有的复杂性和数据规模已超过网络能力,边缘运算让企业能更有效地收集和分析其原始数据,协助组织提高安全性和效能、自动化程序并改善用户体验。研调机构 ResearchAndMarkets 去年底发布报告指出,2030 年全球边缘运算市值预估将从 2022 年的 101 亿美元成长至 1,400 亿美元,期间年复合成长率 (CAGR) 高达 38.8%,而物联网 (IoT) 和连接设备的采用正在显著影响市场。
图1:2022~2030 年边缘运算市值预估
提升速度、带宽、安全,AI Edge 身怀实时洞察力
边缘运算需求不断增长的原因包括:人们对大数据分析的认识提高、智能设备和穿戴装置数量增加以及电信行业支出不断增加。研究显示,依赖云端运算的公司正转向边缘运算,因为它具有较低的延迟和成本可行性,而大企业看中数据处理靠近源头可提高决策能力,亦正向边缘靠拢。自动驾驶和联网汽车的需求不断增长,亦增加了边缘运算解决方案和服务的销量——联网汽车提供有关恶劣天气和道路状况的信息,协助驾驶员控制和导航。边缘运算结合人工智能 (AI) 的「智慧边缘」(AI Edge) 可有效减少事故发生是支撑市场的重要因素。
COVID-19 促使许多企业开始远程营运、使带宽连接需求大增,亦成为边缘运算的成长动力,旨在提升速度、带宽和安全并获取准确、实时的洞察力。大型企业是主要推手,因为所产生大量分散的数据需要进行分析并转移到其他业务中——物联网和工业物联网 (IIoT) 所产生的大数据需要连接广域网,可望促进分众市场的增长。例如,需要体积小、储存容量大的硬件支撑,智能工厂与智慧城市皆为市场做出重大贡献。在营运商网络内部或边界处,智慧边缘通常具有以下强项:低延迟、高带宽、设备处理、数据卸除以及可靠的资源运用。
Matter 无线连接协议:不只解决碎片化,资安准则更吸睛!
物联网 (IoT) 普及的同时也放大了网络安全 (Cybersecurity) 的冲击性,各种通讯协议的资安措施更肩负第一线防护任务。去年底刚出炉的「Matter」无线连接标准,虽是以「简化互操作性、打破智能家居应用藩篱、消除市场破碎化」为要求,却也有业界专家是受到其安全联机机制而吸引,包括:不允许匿名加入、每个装置皆须经过认证才能联机、入网后可供装置在不同生态系运作、须经生态系厂商授予证书后才会传送密钥、开发者可在 GitHub 上检查原始码并修正错误,以及严格管控限制——由管理者批准「存取装置列表」(Access Control List, ACL)。
图2:Matter 建立在互联网协议 (IP) 之上,以安全和隐私为主要设计原则,可为物联网提供经验证的设备身分以及安全的通讯和访问控制
从「应用层」制高点实现身份认证&数字主权
Matter 架构定义部署在设备和控制器上的应用层,并支持基于 IPv6 的网络。它是一个智能家居开源标准项目,由亚马逊 (Amazon)、苹果 (Apple)、谷歌 (Google)、ZigBee 联盟 (后更名为「连接标准联盟」,CSA) 联合发起,旨在开发、推广一项免专利授权费用的新连接协议,以简化智慧家居设备商的开发成本,并提高产品之间的兼容性;Matter 具有统一的设置流程,打破终端用户跨厂商平台的壁垒,让不同的智能家居设备间,使用 IP 地址作为身份证、互相通讯,最终目的是让那些功能各不相同的智能家居有统一的沟通语言,实现一定程度的自动化。
CSA 总裁兼首席执行长 Tobin Richardson 今年初援引世界经济论坛一份名为《2023 年互联世界状况》报告指出,仍有超过 80% 受访者对于物联网的个人数据隐私的保护机制抱持存疑,超过 70% 受访者对于物联网的安全性没有信心;而 Matter 这个基于 Zigbee 所发展出来的 IP 通用物联网协议,在数字主权与一体成形的安全性拥有独特优势。有别于 Wi-Fi 或 Thread 等技术采用额外的网络安全措施,Matter 不须依赖任何底层通讯技术便可在允许设备进入网络前,进行身份认证、判断是否为合法用户。
在获得半导体大厂和 Apple 等终端品牌厂的支持下,Matter 的出现可望打破碎片化市场,又能兼顾用户的数字主权和数据安全性。尽管 Matter 可单独存在,但它亦可与 Wi-Fi 实现无缝、可互操作的连接。Wi-Fi 设备上的 Matter 认证需要 Wi-Fi CERTIFIED,提供 WPA3 以确保个人和企业安全地交换信息;可用认证包括:Wi-Fi 6、低功耗 Wi-Fi HaLow,以及允许用户用二维码和其他低接触式连接设备的 Wi-Fi Connect 等核心功能。SAE 公钥 (SAE-PK) 为公网中使用 WPA3-Personal 的客户端设备提供针对「邪恶双胞胎」(Evil Twin) 攻击的保护。
图3:SAE-PK 凭证生成
图4:SAE-PK 认证
AI Edge 核心谁作主?「智慧演算X开发工具包」见真章!
物联网 (IoT) 已迅速普及日常生活,边缘运算 (Edge Computing) 的重要性亦与日俱增。另一方面,研调机构 ResearchAndMarkets 指出,目前全球出货的所有芯片组中有 85% 皆配备了 AI,到 2026 年,将有超过 63% 的电子产品将拥有某种形式的嵌入式智慧。瑞萨电子 (Renesas) 在新近发布的一篇文章中宣示:由物联网、5G 连接和人工智能 (AI) 所构成的 AIoT 趋势,正在推动收集、储存、处理、分发、保护和驱动数据的方式发生转变,以便将其转化为可从中学习的可操作情报,而互联「智能边缘」(AI Edge) 将是大势所趋。
图5:智慧边缘联网演进
瑞萨电子:分布式边缘运算看旺,工业物联网动力足
瑞萨物联网及基础设施事业部执行副总裁兼总经理 Sailesh Chittipeddi 指出,2020~2022 年期间,其物联网业务的年复合成长率 (CAGR) 大幅跃升了 79%,这与他们陆续收购 Intersil、IDT、Dialog Semiconductor 和 Celeno 等公司,集成传感器、连接、驱动和电源管理四大能力而大幅提升嵌入式处理器的实力功不可没;尤其,工业物联网 (IIoT) 更是潜力无穷。在靠近边缘设备的地方处理数据将产生新的系统价值,如:更低的延迟、增强的隐私。这种巨变需从集中式、基于云端的架构,转向分布式、基于边缘的设计。
Chittipeddi 表示,使用微型机器学习 (ML) 的微控制器 (MCU)/微处理器 (MPU) 节点来定义端点、加速数学模型并提高深度神经网络 (DNN) 性能。当 IoT 端点节点的创建以每年 85% 的 CAGR 呈爆炸式增长时,长线将在预测性维护、快速缺陷检测、生物特征识别和资产跟踪等领域,开辟新的市场和收入来源。有鉴于此,瑞萨在 2022 年再并购以工业算法闻名的 Reality AI 公司,以结合先进讯号处理、数学建模与 AI,建构能在 16~24 位的嵌入式处理器上实施的机器学习模型。与此同时,亦投资 Syntiant 和 Arduino 等公司及赞助 Tiny ML Consortium,目前已在 AIOT 相关生态系统拥有 200 多个技术合作伙伴。
Microchip:资源受限的高负载运算,中档密度 FPGA 是优选
拥有 MPLAB 开发生态系为强大奥援的微芯科技 (Microchip) 主张,智慧边缘若考虑到在最低的功率和热余量下、资源受限的环境中进行高负载运算,中档密度 FPGA 将脱颖而出。Microchip 最新的视讯和图像处理解决方案组合由「PolarFire」FPGA 视讯和成像套件提供支持。新套件使开发者能为利用 AI 和高分辨率成像的边缘应用实现功耗最低、外形尺寸最小的智能嵌入式视觉系统,还可协助使用基于 RISC-V 的 PolarFire 系统单芯片 (SoC) 和 MATLAB/Simulink 进行 FPGA 硬件在环 (Hardware-in-the-loop, HIL) 模拟。
机器视觉、热成像、视讯监控、机器人技术、边缘机器学习推理和人机接口 (HMI) 皆仰赖低功耗的相机和显示器,且须支持高速接口以及数据和设计安全性,进而保护 IP。FPGA 固有的并行处理和高速 I/O 功能,使其成为高分辨率成像和机器学习算法所需的高数据吞吐量的理想处理平台。根据 Microchip 的说法,PolarFire SoC 和 PolarFire FPGA 的总功耗比竞争对手的中端 FPGA 低 30~50%、静态功耗低五到十倍,使其成为「密集型边缘」的理想方案,包括部署在热和功率受限环境中的设备以及用于加速设计的工具。
PolarFire FPGA 亦可作为 Microchip 旗下 MCU/MPU 的加速器搭配使用。挟着强势开发工具为后盾:MPLAB X 整合开发环境 (IDE)、MPLAB XC C 编译程序、MPLAB Data Visualizer——此 MPLAB 插件可追踪应用程序的运行时间并分析功耗,且可使用集成 ML 插件来捕获数据并传输到合作伙伴平台。加上 VectorBlox 加速器 SDK 相助,可对高能效 NN 进行编程;另附带建构基于 PolarFire 视频套件的 AI 相机平台,可评估不同的卷积神经网络 (CNN)。其软件工具包允许使用 TensorFlow、Keras、Caffe 和 ONNX,以及 TinyML 和 TensorFlow Lite 的框架。
图6:用于机器学习数据流的 Microchip 硅平台
NXP:MCU 内建 NPU&DSP,提高智能运算预测性
恩智浦半导体 (NXP) 的 MCX N系列,用于机械手臂、智能电梯、智能门锁这类对智慧运算有更高预测性要求的高性能、低功耗微控制器,便已首次将 NPU 和 DSP 置入 MCU。N 系列中首先登场的是 MCX N94x 和 MCX N54x MCU系列,多核架构设计在提高系统性能的同时还兼顾降低功耗,可实现性能与功耗的完美平衡。MCX N94x 适合工业应用,具有更广泛的模拟和电机控制外设,而 MCX N54x 则是聚焦消费和物联网应用,集成带 PHY 的高速 USB、SD 和智能卡界面等诸多外设。两者皆基于高性能双核 Arm Cortex-M33。
开发人员可使用这些内核和加速器的任意组合来完成具体任务,无需提高 MCU 的频率速度或增加功耗。双核架构允许并行运作应用程序或根据需要关闭单个内核以降低总功耗,例如,在物联网设备的空中 (OTA) 更新期间,主要 M33 内核可处理系统安全,而第二个从核执行控制功能。MCX N 系列的发布,亦是恩智浦自主研发的 NPU 初次亮相,以实现边缘的高性能和低功耗智能。与只使用 CPU 内核相比,内置 NPU 的 ML 吞吐量估可提高 30 倍,使 TinyML 在资源和功率受限的边缘设备上展现超凡的运算力,以实现复杂的深度学习模型。
例如,为门禁控制添加人脸和语音识别功能、为家庭安全系统创建电池供电的玻璃破碎探测器、为电机控制预测维护开发振动传感器、设计配备生物传感器的智能穿戴装置等。顺带一提,MCX N 系列 MCU 集成了 EdgeLock 安全子系统,可安全启动不可变的信任根、实现硬件加速加密、主动和被动入侵检测以及电压和温度篡改检测,支持现场更新和在线传输,并可防止远程原始设计制造商 (ODM) 过度生产。为更好地分析环境并实现本地智慧决策,恩智浦认为,先进的处理、机器学习能力并结合高速连接,是下波边缘运算应用程序的关键要求。
ST:分布式边缘运算胜在延迟、带宽、数据主权、分析效率
选择物联网 MCU,还须考虑连接协议、开发工具包、资安机制与 AI/ML 等软件支持。在 MCU/MPU 根基深厚的意法半导体 (ST) 算是很早投入智慧边缘的先驱厂商之一,相关方案已完全集成到 STM32 生态系,传感器数据由处于系统核心的高能效 STM32 MCU 和 MPU 处理。相关产品包括:
●通用型无线、超低功耗、主流和高性能 MCU;
●具有 AI 加速器的 GP MCU,针对带有嵌入式神经处理单元的低功耗推论运算进行优化 (型号定为 STM32N6,预估今年上市);
●适用于超低功耗应用、具有集成处理单元的 MEMS 传感器;
●用于 OpenSTLinux 上启用 AI 的双核 MPU 系列。
绝大多数 STM32 开发板皆配备传感器及连接到原型智能边缘的应用程序,可用于开发嵌入式 AI 解决方案。例如,基于 STM32L4 MCU,可建立具有扩展传感器和连接性物联网节点的 STEVAL-STLKT01V1 SensorTile 开发工具包——配备 3D 加速度计和陀螺仪、磁力计、飞时测距 (ToF) 趋近传感器、数字麦克风等微机电 (MEMS) 传感器,以及蓝牙 (Bluetooth)/近场通讯 (NFC)/Sub-GHz/Wi-Fi 等无线连接功能,适合音频场景和活动识别应用。
另有适用于工业物联网 (IIoT) 预测性维护和状态监测应用之无线工业节点 (STEVAL-STWINKT1) 的 STWIN SensorTile;用于状态监测的工业传感器评估套件、专为温度和振动监测设计的 STM32 STEVAL-PROTEUS 1 开发板;以及专为穿戴装置或运动感测应用设计的 STM32L5 MCU 开发板。ST 重申,分布式边缘运算可显著降低传输延迟、所需带宽和云端服务器的处理能力,且赋予用户「数据主权」,将个人源数据经过预分析后再提供给具有更高级别解释的服务商。
图7:智能边缘可提供更高效的端到端解决方案
STM32Cube.AI 新增预训练 ANN+远程基准检验模型
ST 为旗下市占广大的 STM32 MCU 开发映像和运行预训练的人工神经网络 (ANN),面向 Edge AI 开发人员提供免费工具 STM32Cube.AI,以便部署符合坊间主流 AI 框架、经过训练的神经网络模型,可经由 STM32CubeMX 环境中的图形接口和命令行使用,也可在 STM32Cube.AI Developer Cloud 在线取得。透过优化 AI 模型的主存储器使用和推理时间,旨在打造最高效的 MCU 神经网络免费代码生成器。近日,ST 再推出「支持在线访问」补充版本——MCU AI Developer Cloud,方便开发者对 STM32 板上的智能边缘模型进行远程基准检验。
开发者还能访问「STM32 model zoo」可训练的深度学习模型和演示储存库以加速应用程序开发,目前支持用例包括用于活动识别和跟踪的人体运动感测、用于图像分类或对象检测的计算机视觉、用于音频分类的音讯事件检测等。它是预训练 ML 的集合,可自动生成针对 STM32 优化的入门套件且可在 GitHub 使用。开发者可透过云端取得 STM32 电路板并定期更新,以便远程测量优化模型的实际性能。STM32Cube.AI Developer Cloud 已经过多家嵌入式开发客户的测试和评估,现可供 MyST 注册用户免费使用 (https://stm32ai-cs.st.com)。
为扩大开发工具的功能并加速嵌入式 AI/ML 开发项目,ST 还推出 NanoEdge AI Studio 及 STM32Cube.AI 的升级版本:前者适合不需开发 NN 的应用,须与 STM32 MCU 及内建 ST 的嵌入式智能传感器处理单元 (ISPU) 的 MEMS 传感器搭配使用;后者则是 STM32 人工智能模型优化器与编译程序,适合 NN 研发,最新释出的 7.3版本已被完全整合至 STM32 生态系,将预先训练好的 NN 转换成能在 STM32 Arm Cortex 内核心 32 位 MCU 上运行的 C 语言程序代码;升级版还可根据性能需求和内存容量调整现有神经网络,或平衡优化最佳效果。
图8:STM32Cube.AI 在 STM32 系列 MCU 之对应
「智慧边缘」点火下一波处理器/控制器竞逐
继整合无线连接功能之后,AI/ML 绝对是下个 MCU 致胜点。芯科科技 (Silicon Labs) 就借助完整的多协议 SoC 产品组合、广泛的开发工具选择及跨无线标准的广泛专业知识,将 ML 引入任何应用程序。ML 开发工具依开发人员的经验,由浅到深依序有 ML Solutions、ML Explorer和ML Experts 三种;考虑到缺乏 ML 经验的开发人员,Silicon Labs 还与 Sensory 合作开发关键词和唤醒词应用程序,并与 Micro.ai 合作进行异常检测。
此外,EFR32xG24 开发工具包允许开发人员在目标设备上加载和运行示例项目,该开发工具包运行使用 TensorFlow 引擎并具有集成 ML 模型的嵌入式应用程序。EFR32xG24 开发工具包 (xG24-DK2601B) 是一个紧凑、功能丰富的开发平台,提供开发和原型无线物联网产品的途径;该开发平台支持高达 +10 dBm 的输出功率,包括对 20 位 ADC 的支持以及 xG24 的 AI/ML 硬件加速器等其他重点功能。上述所有软件都将在此开发工具包上运行。
边缘设备最常见的用途之一就是:透过传感器监控环境变量,而位于设备核心的 MCU 功能也越见强大。现今的 MCU 多是以 SoC 方式呈现,内嵌一个或多个 MPU 以读取数据并进行大量运算、储存并呈现最终结果,当中每个内核都能独立执行指令,可分别处理不同任务。基本上,多核系统由于执行指令快且内核可在不工作时中断电源,功耗会显著低于单处理器内核,因此当红 MCU 几乎皆采多核系统。
智慧边缘设备方兴未艾,执掌帅印的控制/处理核心,无疑是下个兵家必争之地。