当前位置: CompoTech China > 业界资讯 >
 

高性能MCU助力实现边缘人工智能应用

本文作者:徐俊毅       点击: 2025-02-06 11:55
前言:
   在面对云连接的智能物联时代,如何让物联网设备和汽车同时具备智能、安全和互联功能?如何把AI从云端下沉到边缘端,使边缘端具有AI能力?这是在云连接的智能物联时代所要面临的问题。
 
 
边缘端AI的时效性更强,隐私保护性更好,更有效更高效的做自主计算和执行。同时信息安全是在云连接智能时代不可或缺的一个能力,在设备和设备之间,设备和云之间,边缘AI能够做识别验证、数据保护,实现安全能力。同时云端的存在能够实现大语言模型,有更多的算力实现这些语言模型。

意法半导体中国区微控制器、数字 IC 与射频产品部 (MDRF) 微控制器产品市场经理丁晓磊 (Lisa DING)表示,我们会越来越多的看到,人工智能呈现爆炸性增长,让推理端慢慢的从云端下沉到边缘端。在构建一个具备 AI算力的世界里,我们会考虑如何在云端和边缘端做这样的一个分布,也慢慢的在以云端为中心,转向以边缘端为中心,但要以边缘端为中心,就要需要有不同的硬件和软件支持。

丁晓磊表示,边缘端推理具有巨大的优势,第一个就是非常好的实时性,有超低的延时,能够满足在工业、消费类、医疗类、家电上各种实时性的需求。同时边缘端因为算力的不断的增强和成本的降低,可以有效的减少数据从边缘端上传到云端的过程,可以极强极大地增强隐私性和安全性,同时高能效、低的数据传输率,以及低功耗,还有一些更多新型操作,这些都可以在边缘端实现。

在嵌入式人工智能领域,更多的讨论在边缘端具备哪些能力及应用?如何利用人工智能可以去升级你现有的现有设备和现有应用? 意法半导体除了能够把现有设备升级之外,以前的应用里面还有非常多的边缘智能,这些模型要跑在大的SoC芯片上面,现在,随着意法半导体MCU的算力越来越强,过去这些在大SoC上面的应用也可以用在MCU上,这样就会拉低BOM成本,整个外围器件就会减少,设计的复杂性随之降低,对于开发人员来说也会更加友好。
丁晓磊表示,以前一定要有云端才能实现更高端的服务,现在,某些部分可以下沉到边缘端,比如说,我们之前做的目标分类、姿态估计、目标分割,这些预算在过去都是要在云端实现的,现在可以在边缘端,甚至于可以在MCU端去实现所有这些新的应用。

让边缘AI随处可见
在边缘AI领域,ST已经深耕有大概10多年的时间,ST希望边缘AI随处可见,且证明未来 AI将会随处可见。我们看到越来越多的采用边缘人工智能的解决方案。
 
 
根据ABI市调机构的数据,到2030年,边缘端TinyML MCU市场复合年增长率达到113%。,不管在电源管理,还是电弧检测、人脸目标识别,以及异常检测等应用领域,这么高的增长率代表会有越来越多的案例被逐渐采用。

丁晓磊表示,随着越来越多的传统的嵌入式开发者入局人工智能,ST开始扩建生态圈,为用户提供更多的工具和开发便利,这些传统的嵌入式开发者开始越来越多的利用MCU去做边缘的人工智能开发。截止到2024年上个季度为止, 全球ST edge AI 开发工具活跃客户数量达到五万多人,ST也推出了ST edge AI Suite边缘人工智能开发套件,这个套件涵盖了从创意想法到数据采集训练再到模型优化部署和验证整个边缘人工智能的开发过程。

ST是一家MCU硬件公司,在人工智能MCU里面,NPU是一个关键组件,Neural-Art Accelerator是ST专有知识产权的神经网络处理单元。以后,ST还会有搭载Neural-Art Accelerator的后续产品及新的产品规划。Neural-Art Accelerator是一套ST内部自研的的IP,能够更好地加速人工智能的应用,并提高 AI模型的处理的效能。

首款具有AI加速功能的高性能STM32 MCU
   STM32N6的定义是,首款具有AI加速能力的高性能的STM32 MCU。这款STM32N6。首先,它是目前为止所有STM32芯片中性能最强的,3360 Coremark性能。其次,STM32N6分为两个系列,这两个系列有相同的基因,都是高性能,不同的地方是,一个是AI系列,另一个通用系列;STM32N6有六种封装,客户可以选择,有NPU的AI处理的和不带NPU的AI处理能力,可以选择用它作具备需要AI处理能力的应用,而当不需要AI处理能力的时候,他依然是一颗非常优秀的高性能MCU。
 
 
   STM32N6是一个800MHz主频的ARM Cortex-M55内核,目前是ST所有的MCU内核中主频最高的,然后Coremark也是能力最强的,它带有嵌入式的Neural-Art Accelerator的硬件加速单元,这个加速单元在算力处理得当的情况下,它可以与ARM Cortex-M55内核完全独立并行工作,可以作为ARM Cortex-M55的协处理器,做AI的加速能力运算。
 
此外,STM32N6还有非常好的多媒体和图形体验,也是所有系列中图显能力最强的。它还加了一个摄像头处理能力,ST在这里加了ISP,也就是计算机视觉管线处理能力,业内很少有厂商这样做,ISP能够把拍到的照片做非常轻量级的图像处理,得到画质非常好的照片。
 
同样,这个产品一直继承了STM32的基因,不仅和之前STM32生态系统无缝连接,还有 ST edge AI Suite工具套件,配备非常好的资源和案例。STM32N6不仅有图形显示的功能,还兼容STM32的之前的TouchGFX的图形软件包,STM32N6帮助开发者实现最佳设计。
 
   STM32N6上的 Neural-Art Accelerator加速器,是ST自研的专有的神经网络单元,可以提高人工智能的处理能力:你在一个MCU上用MCU功耗去实现边缘AI的能力。大家知道,能力的强弱跟功耗的强弱一般来说是成一个正比,但是,STM32N6就极好地实现了最优化(两全其美)的效果:用相对最低的功耗实现最高的性能。

 
ST32N6的处理器内核是ARM的v8.1最新架构的 Cortex-M55,性能达到3360 Coremark,1280 DMIPS,在Coremark下面还加了新的Helium内核扩展指令集,这是以前在ARM Cortex-M7的内核里所没有的ST32N6还有目前为止STM32所有MCU里面容量最大的SRAM:4.2MB SRAM,很多客户不需要再去外部扩存,这个SRAM就可足以满足他们的需求。此外,这是ST目前唯一一颗带MIPI CSI接口的MCU,并且还有专门的图像处理单元ISP,在外接一个没有ISP功能的摄像头情况下,用户仍然能够实现ISP功能。关于它的,STM32N6内置的多媒体能力也是目前所有的MCU中多媒体能力最强的,有2.5D的GPU加速器,同时它有H264的编码和JPEG编解码,这些都是硬件的支持。信息安全一直是STM32MCU的一个强项,Cortex-M55内核和NPU会自带ARM的TrustZone,同时自己也会有相关的信息安全外设,让大家更好地实现安全相关认证。

 
    丁晓磊表示,产品要有好的特性,同时也要有完善的生态,去降低所有开发者的使用门槛,加快项目的开发进程。到现在为止,STM32所有的硬件软件已经完全的准备就绪,这意味着我们所有的用户都可以在代理商或者是ST的销售那里去申请到ST的硬件开发板,我们有 DK板和Nucleo板,在ST官网,大家可以找到所有软件去用去开发。
 
    在模型和代码设计上,不同于以往的MCU开发的,ST会做一个叫Edge AI Model Zoo模型库放在GitHub上,这个模型库为大家提供了所有非常详细的ST能够实现的模型,包括声音检测、目标识别、目标分割,还包括追踪等。当用户要找不同的AI模型的时候,需要去看不同的AI模型到底是在哪一个STM32 MCU上去运行?或要去评估,看它能在哪一个MCU上去跑,推理时间如何,RAM占用空间如何,就可以使用STM32 Edge AI Developer Cloud开发者云在线开发工具,快速帮你评估出所需要的存储器大小以及推理时间,这个是跟ST在服务器后台所连的实际板子相关,能够快速做出实时预算。在模型的优化上,ST有两个工具, Cube AI及Edge AI core,后者提供了Command Line这样一些工具,所以,这一系列的完善的生态系统可以帮助用户快速做到STM32N6的各种开发。
 
   丁晓磊表示,STM32N6作为一颗通用的MCU,现在它在非常多的领域都有一些落地,比如说,在个人产品、消费类、可穿戴设备,包括机器人、智能楼宇、白色家电、智能工业、无人机、智能家居。在美国、欧洲、APEC和中国不难看到使用STM32N6的成功案例,客户共同感觉就是STM32N6让他们能够去创新,能够快速的实现之前MCU不能实现的功能。

   另外一个是STM32N6在中国区的案例。这是ST跟南方的一家叫莫界 Metabounds做可穿戴一体化AR眼镜的客户合作,STM32N6通过MCU的功耗和成本,带来MPU级别的AI性能,提升了机器视觉处理能力和优化。Neural ART硬件加速器的图形和多媒体性能非常优异,还具备专用图像信号处理器ISP,保证AI眼镜产品具备超轻的重量,紧凑的外形,在不影响续航时间的情况下,实现非常迅速的AR功能。STM32N6这些能力让莫界能够做突破,让现在目前整个业内最轻量级的只有35克的这样的一体化AR眼镜成为可能。

 

   目前,全球已经有50多家早期客户在用STM32N6做产品的开发和设计。未来STM32N6将不断为ST的创新产品赋能,而意法半导体的全方位支持,将确保了开发过程的顺利进行。