当前位置:首页>公司新闻>行业掀AI+物联网热 谈谈打造IoT的AI芯片背后的逻辑

行业掀AI+物联网热 谈谈打造IoT的AI芯片背后的逻辑

发布时间:2018-05-07 点击数:3183

AI芯片领域近年来一片火热,不论是资本市场,还是大众创业,无不对其表现出极大的热情。云知声对AI芯片又有着怎样的需求与思考?接下来,本文即将从AI与IoT融合的角度(AIoT),为您详实解析。

一、AIoT领域中人机交互的市场机会

自2017年开始,“AIoT”一词便开始频频刷屏,成为物联网的行业热词。“AIoT”即“AI+IoT”,指的是人工智能技术与物联网在实际应用中的落地融合。当前,已经有越来越多的人将AI与IoT结合到一起来看,AIoT作为各大传统行业智能化升级的最佳通道,已经成为物联网发展的必然趋势。

在基于IoT技术的市场里,与人发生联系的场景(如智能家居、自动驾驶、智慧医疗、智慧办公)正在变得越来越多。而只要是与人发生联系的地方,势必都会涉及人机交互的需求。人机交互是指人与计算机之间使用某种对话语言,以一定的交互方式,为完成确定任务的人与计算换机之间的信息交互过程。人机交互的范围很广,小到电灯开关,大到飞机上的仪表板或是发电厂的控制室等等。而随着智能终端设备的爆发,用户对于人与机器间的交互方式也提出了全新要求,使得AIoT人机交互市场被逐渐激发起来。


行业掀AI+物联网热 谈谈打造IoT的AI芯片背后的逻辑


图:AIoT发展路径

以智能家居市场为例,数据显示,2018年中国智能家居规模将达到1800亿元,到2020年智能家居市场规模将达到3576亿元。分析师预测,2021年全球智能家居市场规模将达5000多亿元。飞速爆发中的AIoT市场,所蕴藏的人机交互需求及前景无疑是令人期待的。

人类生活的数字化进程已持续约三十年,这些年我们经历了从模拟时代到PC互联时代再移动互联时代的演进,而目前我们正处在向物联网时代的演进过程中。从交互方式上来讲,我们可以看到机器是越来越“迁就”人的:从PC时代的键盘和鼠标到移动时代的触屏、NFC以及各种MEMS传感器,再到物联网时代正在蓬勃发展的语音/图像等交互方式,使用门槛正在变得越来越低,这导致了越来越多的用户的卷入。同时我们需要注意到另一个深刻的变化,即由于交互方式的演进(至少是重要原因之一),大量的新维度的数据也在不断地被创造出来和数字化,比如PC时代的工作资料和娱乐节目,智能手机时代的用户使用习惯、位置、信用和货币,再到物联网时代的各种可能的新数据。

在物联网时代,交互方式正在往本体交互的方向发展。所谓“本体交互”,指的是从人的本体出发的,人与人之间交互的基本方式,如语音、视觉、动作、触觉,甚至味觉等。例如,通过声音控制家电,或者空调通过红外来决定是否应该降温,通过语音和红外结合来进行温度的控制(侦测到房间里没人的时候,即便电视节目里提到了“降温”,空调也不做反应)。

新的数据是AI的新的养料,而大量的新维度的数据正在为AIoT创造出无限可能。

从AIoT发展路径来看,当前行业人士普遍认为,其将经历单机智能、互联智能到主动智能的三大阶段。

单机智能指的是智能设备等待用户发起交互需求,而这个过程中设备与设备之间是不发生相互联系的。这种情境下,单机系统需要精确感知、识别、理解用户的各类指令,如语音、手势等,并正确决策、执行和反馈。AIoT行业正处于这一阶段。以家电行业为例,过去的家电就是一个功能机时代,就像以前的手机按键式的,帮你把温度降下来,帮你实现食物的冷藏;现在的家电实现了单机智能,就是语音或手机A P P的遥控去实现调温度、打开风扇等。

无法互联互通的智能单品,只是一个个数据和服务的孤岛,远远满足不了人们使用需求。要取得智能化场景体验的不断升级、优化,首先需要打破的是单品智能的孤岛效应。而互联智能场景,本质上指的是一个相互互联互通的产品矩阵,因而,“一个大脑(云或者中控),多个终端(感知器)”的模式成为必然。例如,当用户在卧室里对空调说关闭客厅的窗帘,而空调和客厅的智能音箱中控是连接的,他们之间可以互相商量和决策,进而做出由音箱关闭客厅窗帘的动作;又或者当用户晚上在卧室对着空调说出“睡眠模式”时,不仅仅空调自动调节到适宜睡眠的温度,同时,客厅的电视、音箱,以及窗帘、灯设备都自动进入关闭状态。这就是一个典型的通过云端大脑,配合多个感知器的互联智能的场景落地。

主动智能指的是智能系统根据用户行为偏好、用户画像、环境等各类信息,随时待命,具有自学习、自适应、自提高能力,可主动提供适用于用户的服务,而无需等待用户提出需求,正如一个私人秘书。试想这样的场景,清晨伴随着光线的变化,窗帘自动缓缓开启,音箱传来舒缓的起床音乐,新风系统和空调开始工作。你开始洗漱,洗涑台前的私人助手自动为你播报今日天气、穿衣建议等。洗漱完毕,早餐和咖啡已经做好。当你走出家门,家里的电器自动断电,等待你回家时再度开启。

二、AIoT的人机交互对AI芯片需求

边缘计算指在靠近物或数据源头的网络边缘侧,融合网络、计算、存储、应用核心能力的开放平台,就近提供边缘智能服务,满足行业数字化在敏捷连接、实时业务、数据优化、应用智能、安全与隐私保护等方面的关键需求。在行业内有个十分形象的比方,边缘计算犹如人类身体的神经末梢,可以对简单的刺激进行自行处理,并将特征信息反馈给云端大脑。伴随AIoT的落地实现,在万物智联的场景中,设备与设备间将互联互通,形成数据交互、共享的崭新生态。在这个过程中,终端不仅需要有更加高效的算力,在大多数场景中,还必须具有本地自主决断及响应能力。拿智能音箱举例,其不仅需要支持本地唤醒的能力,还应该具备远讲降噪的能力,而由于实时性以及数据有效性的考虑,这方面的计算必须发生在设备端而不是云端。

智能家居行业作为AIoT人机交互最重要的落地场景,正吸引越来越多企业进入。在这其中,既有如Apple、Google、Amazon等这样的科技巨头,也有像海尔、三星这类的传统家电厂商,当然也不乏小米、京东这样的互联网新贵。基于互联智能的构想,未来的AIoT时代,每个设备都需要具备一定的感知(如预处理)、推断以及决策功能。因此,每个设备端都需要具备一定不依赖于云端的独立计算能力,即上面提到的边缘计算。

在智能家居的场景下,通过自然语音的方式与终端设备进行交互,在当前已成为行业主流。由于家庭场景的特殊性,家用终端设备需精准区分、提取正确的用户命令(而不是家人在谈话时无意说到的无效关键词),以及声源、声纹等信息,因此,智能家居领域的语音交互对于边缘计算也提出了更高要求,具体表现在以下几方面:

1)远讲降噪、唤醒

家居环境下声场复杂,比如电视声音、多人对话、小孩嬉闹、空间混响(厨房做饭、洗衣机等设备工作噪音),这些容易干扰用户与设备间正常交互的声音,很大概率会在同一时间存在,这就需要对各种干扰进行处理、抑制,使得来自真正用户的声音更加突出。在这个处理的过程中,设备需要更多的信息量来进行辅助判断。家居场景语音交互的一个必备功能是使用麦克风阵列进行多通道的同步声音录入,通过对声学空间场景进行分析,使得声音的空间定位更加准确,大幅提升语音质量。另一个重要功能是通过声纹信息辅助区分真正用户,使他的声音从多人的窜扰中更加清晰地区分出来。这些都需要在设备端实现,且需要较大的算力支持。

2)本地识别

家居领域人机交互的本地识别离不开边缘计算,具体体现两个方面:

高频词。从实际统计来看,用户在特定场景下的常用关键词指令数量有限。例如车机产品,用户最常使用的可能是“上一首/下一首”,空调产品有可能最常用的命令是“开启/关闭”等,这些用户经常用到的词就叫做高频词。对于高频词的处理,完全可以放在本地处理而不依赖于云端的延时,从而带给用户最佳的体验。

联网率。在智能家居产品尤其是家电产品落地的过程中,联网率是一个问题。如何在不联网的情况下让用户感知到语音AI的强大,进行用户培养,也是边缘计算在当前的一个重要作用。

3)本地/云端效率的平衡

家居领域的自然语言交互过程中,当所有的计算被放到云端时,声学计算的部分将对云端计算造成较大压力,一方面造成云平台成本的大幅增加;另一方面带来计算延迟,损害用户体验。自然语音交互分成声学和自然语言理解(NLP)两个部分,从另一个维度上来讲,可看成是“业务无关”(语音转文字/声学计算)和“业务有关”(NLP)的部分。业务有关的部分毫无疑问需要在云端解决,例如用户问天气、听音乐等需求,那么设备对用户语句的理解,以及天气信息的获取必须通过联网来完成。但是,对于用户语音到文字的转换,例如下达指令“打开空调、增加温度等”,其中的部分甚至大部分计算是有可能在本地完成的。这种情况下,从本地上传到云端的数据将不再是压缩后的语音本身,而是更为精简的中间结果甚至是文本本身,数据更为精简,云端计算更为简单,则响应也更为迅速。

4)多模态的需求

所谓多模态交互即多种本体交互手段结合后的交互,例如将多种感官融合,比如文字、语音、视觉、动作、环境等。人是一个典型的多模态交互的例子,在人与人交流的过程中,表情、手势、拥抱、触摸,甚至是气味,无不在信息交换的过程中起着不可替代的作用。显然,智能家居的人机交互势必不止语音一个模态,而是需要多模态交互并行。举个例子,智能音箱如果看到人不在家,那就完全不需要对电视里误放出的唤醒词进行响应,甚至可以把自己调到睡眠状态;一个机器人如果感觉到主人在注视他,那么可能会主动向主人打招呼并询问是否需要提供帮助。多模态处理无疑需要引入对多类传感器数据的共同分析和计算,这些数据既包括一维的语音数据,也会包括摄像头图像以及热感应图像等二维数据。这些数据的处理无不需要本地AI的能力,也就对边缘计算提出了强力的需求。

三、边缘计算带来的AI芯片需求

AI算法对设备端芯片的并行计算能力和存储器带宽提出了更高的要求,尽管基于GPU的传统芯片能够在终端实现推理算法,但其功耗大、性价比低的弊端却不容忽视。在AIoT的大背景下,IoT设备被赋予了AI能力,一方面在保证低功耗、低成本的同时完成AI运算(边缘运算);另一方面,IoT设备与手机不同,形态千变万化,需求碎片化严重,对AI算力的需求也不尽相同,因此很难给出跨设备形态的通用芯片架构。因此,只有从IoT的场景出发,设计定制化的芯片架构,才能在大幅提升性能的同时,降低功耗和成本,同时满足AI算力以及跨设备形态的需求。相比于传统芯片,定制化的AI芯片在运算效率及存储器带宽上有绝对优势,其优势主要体现在以下几点:

首先,采用并行运算架构及专用矩阵加速器等技术,例如Systolic Array架构或更复杂的并行运算架构实现运算单元的利用率,甚至采用Winograd等特定的矩阵加速器,降低矩阵运算的运算量,从而提高运算效率。


行业掀AI+物联网热 谈谈打造IoT的AI芯片背后的逻辑


其次,从降低外部存储器带宽的角度出发,通过数据压缩或相关功能模块之间的pipeline技术,降低内存带宽。以NVIDIA公司开源AI引擎NVDLA为例,在convolutions、activations、pooling等模块之间设计了专用的数据通路,模块之间的数据交互不在经过系统内存,而是由专用的数据通道完成。


行业掀AI+物联网热 谈谈打造IoT的AI芯片背后的逻辑


图:NVDLA核心架构

随着芯片运算效率的提升及外部存储器数据带宽的降低,芯片运算所需的时钟周期和内存访问次数将会大幅减少。因此,相较通用芯片而言,AI芯片可以在更低的主频、更小的芯片面积,完成机器学习中同等任务量的计算。采用更低的主频,不单降低了芯片的动态功耗,还可以降低芯片工作电压,从而进一步降低芯片动态功耗。另外,低主频使得在芯片加工工艺的选上有更多的选择,进一步影响芯片的静态功耗。

由于芯片面积、功耗直接影响芯片封装的选择,因此AI芯片在芯片封装上也要比传统芯片更有优势。由此来看,AI芯片的性价比将远远大于传统芯片。

四、AI芯片落地面临的挑战

AI芯片在保证高性能、高能效比的同时,兼顾灵活性和通用性。AI算法有应用领域广、算法种类多样化以及算法演进较快的特点,因此对AI芯片架构设计提出较高的要求。只有性能与通用性兼顾的AI芯片才会有广阔的市场和较长的生命周期。只有在芯片架构与软件算法之间形成较高的耦合度时,芯片的性价比才能够达到较高的值,因此离开对算法的深刻理解是很难设计出高效的AI芯片的。而直接对AI算法的硬件化将极大地降低芯片灵活性,因此AI芯片的硬件加速往往体现在比算法更底层的数学运算上。由于AI算法是建立在一系列的数学运算之上的,因此设计一款高性价比和高灵活性的芯片需要从数学运算及运算之间的数据依赖着手。在大量数据统计的基础上,根据数据运算的复杂度、出现的频度、数据依赖关系等信息,提炼基础数学运算指令及数据搬运指令,并根据这些指令完成芯片架构的定义和实现。因此,AI芯片架构设计及实现是AI芯片设计的中间一个小的环节,而AI指令集设计才是AI芯片成功的更为关键的因素。

做AI芯片不是搞军备竞赛,任何产品在推向市场的过程中都有其产品定位,AI芯片也不例外。特定的AI芯片是面向特定场景的,而场景则由芯片所面向的产品、市场所共同影响决定,不同场景对于AI芯片在价格、功耗,以及所支持的功能方面有着截然不同的需求。比如,大型服务机器人和智能开关,对于AI芯片的价格要求可能会有比较大的反差,毕竟二者的售价相差悬殊,对于同一售价的AI芯片,出于产品成本的考虑,所表现出来的接受度可能截然相反。因此AI芯片不仅要做得来,还得卖得出。

在AI软件生态方面,AI开发框架(Framework)相对碎片化,比如TensorFlow(Google),CNTK(Microsoft)及Torch7(Facebook)等,整个行业尚未形成统一的标准。在标准化方面的探索主要包括Microsoft和Facebook联合推出的ONNX,Khronos组织推出的NNEF等神经网络交换层标准。不可否认,神经网络交换层标准是解决当前碎片化AI框架的捷径,但该标准处于起步阶段,标准的成熟还需要较长的路要走。因此AI芯片厂商解决各种框架之间的兼容性问题,对AI芯片的通用性带来极大的挑战。在AI产品生态方面,AI芯片的规模性的落地领域尚在探索之中。同时在落地过程中,AI芯片不是孤立的,还需要软件应用、解决方案以及服务商的支持。AI芯片归根结底是一个产品,既然是产品,其落地时的交付物可能是芯片本身,但更可能是芯片+应用+服务。如果只有芯片,但是没有基于芯片的算法和应用,那么无法称之为一个完整的产品。举例来说,对于智能音箱而言,作为一个解决方案的提供商,AI芯片只是其产品中的一小部分,而其他部分例如基于AI芯片的应用、云端的智能语音交互服务、内容服务以及服务支持等,这才是落地中更为重要的一环。在AI芯片落地的过程中,客户需要的一般是一个完整的方案,如果仅仅提供AI芯片的话,势必需要在应用、云服务等各方面寻找相应的合作伙伴,才有可能对客户提供一个完整的解决方案。

五、云知声在AI芯片落地方面的探索

就云知声而言,在芯片产品形态方面,实际上公司已经过很长时间的探索。从市场着手,云知声在家居、智能音箱、儿童机器人等市场方面已经基于IVM(通用芯片方案)的产品形态,验证了市场、产品、用户场景的合理性。而伴随合作客户在更多产品种类和形态上对成本、稳定性、集成度等方面的呼声愈高,进而推出自研AI芯片就成为一件水到渠成的事情。


行业掀AI+物联网热 谈谈打造IoT的AI芯片背后的逻辑


基于Unisound的AI指令集和DSP指令集,结合语音应用场景,以麦克风阵列信号处理、语音识别及语音合成为一体的全新的芯片架构。通过运算单元之间的可编程互联矩阵保证运算效率的同时,采用多级-多组-多端口的Memory架构保证片内数据带宽的提升及降低芯片功耗。在架构灵活性方面,通过Scratch-Pad将主控CPU与AI加速器内部RAM相连,提供高效的CPU与AI加速器之间的数据通道,以便CPU对AI加速器运算结果进行二次处理。另外,连接各个运算单元的可编程互联矩阵架构,提供了扩展运算指令的功能,从而进一步提升硬件架构的灵活性及可扩展性。芯片架构方面的其余探索,包括多级多模式唤醒、从能量检测到人类声音检测到唤醒词检测、针对语音设备及使用场景的定制化Power Domain等技术,将芯片功耗降至最低。在业务体系上,云知声在2014年即提出了“云端芯”的技术架构体系,通过云端服务、设备端应用以及嵌入式硬件面向IoT领域构建完整的语音AI解决方案。随着云知声自主AI芯片的落地,通过提供标准化的人机交互产品对接接口,可为合作客户提供允许在端和云两个方面均可进行高度定制的解决方案。

总之,AIoT的人机交互是一个巨大的市场,并由此带来了对AI芯片的巨大需求。但在AI芯片的落地过程中,面临着研发、产品定位以及商业化路径等多方面的挑战。在研发方面,需要针对实际采用的AI算法进行深度迭代优化,以满足产品需求并保持架构的灵活性;在产品定位方面,鉴于IoT设备碎片化的现实,必须先考虑应用场景和适用范围,由此再倒推AI芯片的功能和性能要求;在商业化路径方面,最终客户需要的往往是整体解决方案而非芯片本身,因此如何构建一个完整的AI解决方案,是每个AI芯片玩家必须考虑的事情。