你是否想过,未来某一天,你可以像唤醒智能音箱一样语音控制电梯?
在这场疫情到来之前,我不曾想过这个问题。
但是,在疫情中,它确实在某些医院、园区、写字楼中开始应用。
改造一部声控电梯,需要几步?
2020年,复工后的生活让在家中备受各类种疫情信息轰炸的上班族多少有些忧虑,当从“云办公”切换到“坐班制”的模式时,这种忧虑尤其明显。
经历了封路、封城、小区戒严,如今世卫组织又将新冠肺炎列为“大流行病”,一百多个国家出现确诊病例超10万例,让区域防控机制不断升级。快递、外卖、公共交通均针对疫情做出了调控,通过无接触避免病毒传播,因疫情而起的无接触服务由此席卷了关乎民众出行的各个行业,甚至电梯这一狭小空间也被考虑在内。
不得不说,物联网时代对用户体验的高度重视,以及各厂商的响应速度,达到了常人难以想象的地步。不少电梯厂商通过与互联网厂商合作,应用各类新兴控制方案,开始对电梯进行改造。
其中,智能语音方案在此期间应用尤其广泛,声控电梯也成为疫情期间被唤醒的一类“新物种”。
2月18日,思必驰位于苏州腾飞创新园的总部大楼完成了声控电梯的改造。
整部电梯的改造其实可以分为内外两部分,在电梯内部,加装选层装置,在电梯外部,加装呼层装置,两者均是通过语音模拟物理按键,将按键并联语音控制,实现语音控制电梯。
整个声控电梯改造过程很快,不过由于考虑到安全性、可靠性等因素,我们当时请了原装电梯的售后工程师来做现场指导,我们边做边学,实际上也只用了两个小时。
思必驰在此次疫情期间推出了智能电梯离线语音方案,这一方案在思必驰总部大楼电梯中的应用,多少有些场景验证的意思,其实早在2月2日,内部就已正式立项并开始紧急研发的方案。
当时的主要工作是将我们此前成熟的语音方案移植到电梯场景中,做一套完整的智能电梯语音方案。
到2月15日,这一方案的软硬件其实都已经调试完成,当时在找实际落地设备时,想到我们公司大楼刚好有电梯,于是就和公司申请,将这一方案应用到了我们总部大楼的电梯中。
看似一次简单的电梯改造,看似一个简单的语音方案研发,其实中间仍有诸如语音模型训练、硬件方案设计等诸多细节,这些细节的打磨主要解决的是拾音、降噪问题。
语音模型:电梯场景中特殊的噪音与降噪
国际上针对智能语音技术的识别率、翻译准确率等参数的相关竞赛已经进行了将近十年,智能语音技术也迭代优化了近十年,如今智能语音技术的成熟度已经足以支撑相关产品应用到家居、车载等生活场景中,市面上也有了科大讯飞、思必驰、云知声、声智科技等一批以语音技术为核心的AI独角兽企业及初创企业。
雷锋网向多家厂商了解到,电梯场景中的语音方案与家居、车载场景中的语音方案基本类似,不过由于所需的控制功能(呼叫电梯、选层)更简单,不需要太多定制化,最需要考虑的反而是基本的降噪问题。
电梯场景中应用的语音控制方案需要考虑哪些噪声?梅剑雄解释称:
其实在密闭的电梯空间中,噪声分两种,设备自身的噪声,如开关门产生的摩擦声、运行的声音、通风设备的风噪;还有外部的噪声,如乘客说话的声音、电梯开关门产生的风压,开关门产生的风压噪声。
其实这些因素在此前多年研发的方案中我们都有考虑到,只不过此次在电梯中应用需要做一些特殊的定制优化。
对于这样的噪声处理,思必驰通过对降噪算法进行场景化优化,以及搭载自家生态公司深聪智能研发的语音芯片TH1520,进行降噪。
我们针对语音算法在芯片上做了很大的性能优化,使得算法与芯片完全适配,这样就可以通过此前80%的算力实现100%的性能,节省下来的算力可以通过增加算法的复杂度,进一步提升降噪能力。
正如神枪手都是用子弹喂出来的一样,好的AI算法也都需要用大量数据来训练,AI语音算法显然也是如此。据梅剑雄透露,思必驰智能电梯语音方案研发过程中,一周内,通过公司员工和思必驰的众包平台收集了数万分钟电梯场景下的录音数据(其中80%为有效数据)作为数据集对模型进行了再次训练和优化。
在硬件上,我们对麦克风的位置也做了多次调整,需要反复多次试验,以寻求在电梯场景下的最佳位置。
据官方信息显示,思必驰此次发布的智能电梯离线语音方案,“1-3米唤醒成功率>97%、识别率>95%”。
同样对智能语音解决方案有深入理解的科大讯飞,也在近期对外发布了智能电梯离线语音方案,科大讯飞消费者业务群AIoT平台产品研发部副总经理周正友告诉雷锋网:
考虑到电梯运行噪音的干扰、封闭小空间声场的变化、空间光滑引起的声音反射的变化等干扰因素,讯飞智能电梯语音解决方案采用传统HMM-NN模型和基于深度学习的End-to-End方案的混合模型架构,发挥End-to-End系统高召回率的特性,同时兼顾HMM-NN系统误唤醒稳定的特性。此外,在语音模型和声学模型上也做了优化:
语音模型,采用了基于深度学习的解码网络,针对高频词汇进行了重点训练,增强高频指令集的识别率,降低串扰率;
声学模型,针对电梯密闭场景以及常用词汇(尤其是数字)进行训练数据扩充,提升高频指令集的音素切分效果。
离线语音方案只是智能语音技术中的一个分支,可以通过对本地指令的支持和识别,来满足诸如电梯此类更为本地化、更加注重功能性的场景应用。
然而,在此次疫情中也涌现出了诸多智能电梯在线语音方案,包括科大讯飞、云知声等厂商在发布智能电梯离线智能语音方案的同时,也发布了在线版语音方案。