声智科技助力小米壁画电视 揭秘远场语音交互如何提升家庭影院体验

2019年4月23日,“小米电视2019春季新品发布会”在北京举行,智能家居系列新产品——小米壁画电视正式亮相。小米壁画电视主机搭载了声智科技远场智能交互系统SoundAI Azero,是小米电视音响的全新升级,通过语音指令即可实现频道切换、音量调节、热门搜索等操作,为用户提供新型影音娱乐体验。


发布会1.jpg(小米电视发布会)


小米电视主机的出现成功兼顾了电视机超大屏幕的视觉享受和影院级别的音效享受,那么小米壁画电视主机的面市又会为电视音响领域带来哪些新的改变呢?专注声学前沿技术和人工智能交互的声智科技将为大家探究小米电视主机究竟如何提升家庭智能影院体验,揭秘其背后的语音交互逻辑。


afe09d9dgy1g2ckv5hhhlj21o00u07wj.jpg

(小米壁画电视)


小米壁画电视主机延续小米产品一如既往的简约风格,流线型机身,内置6个发声单元,支持Dolby和DTS-HD双解码,配置有2.5英寸中低扬声器x2、20芯球顶高音x2和倒相式音腔X2,超重低音炮11升大音腔。声智科技为小米壁画电视主机内置的Soundbar量身定制了4麦线型麦克风阵列,搭配专属远场语音识别、语音唤醒等技术,为用户带来更加流畅自然的家庭智能影院新体验。


001.jpg

(小米壁画电视主机)

 

4麦线形麦克风阵列,优化拾音效果


在真实家居场景中,小米壁画电视主机一般悬挂于墙面或置于桌面,用户使用习惯提出的交互角度要求在0-180度之间。因此,内置的Soundbar主要面对的拾音区域集中于前方3-5米范围内,交互角度为180度。为实现更简洁流畅的外观体验和更优质的音响效果,小米壁画电视主机采用全金属镂空滤网外壳,镂空面积不足外壳面积的一半,且外壳内置防尘网,但这一结构设计也造成了声音信号在拾取过程中的部分损失。

 

基于其内置扬声器等器件的声学结构以及交互场景的需求,声智科技为其提供了定制优化的4麦线形麦克风阵列方案,有效实现180度精准拾音。4麦线形麦克风阵列拥有较多优势,相较于双麦和环形6麦等麦克风阵列方案而言,4麦麦克风阵列在拾音效果和声源定位能力方面均优于双麦,成本低于6麦,而且较6麦环形麦克风阵列而言更适用于客厅等家居环境,是此应用场景下的最优配置。同时,线形麦克风阵列也有效避免了环形麦克风阵列在此应用场景中拾音范围过大、声源定位错误率较高等问题。

 

远场智能交互系统,打造无障碍唤醒


在真实的使用环境中,小米壁画电视主机内置的麦克风阵列和扬声器距离非常近,当音量很大时,要保证语音识别的精准度就变得非常困难。同时,小米壁画电视主机内置的Soundbar的麦克风阵列固定在结构件上,与金属滤网外壳有一定距离,声音信号在穿透外壳抵达麦克风阵列的过程中,遇到外壳内壁会产生大量反射,这也对声音信号的拾取能力提出了较高要求。


针对壁画电视面对的复杂远场语音交互情况,声智科技推出了以垂直抗强躁识别技术(VAN)、垂直抗噪唤醒技术(AKS)为代表的专属技术,匹配实际应用场景,为用户提供出色的智能交互体验。此外,声智科技智能交互系统SoundAI Azero的混响消除算法可有效降低声波传输过程中产生的混响,声源定位和自噪声抑制算法可有效应对背景噪声,从而保证壁画电视精准捕捉语音指令,实现随时打断、随时唤醒的无障碍交互体验。

2017年,声智科技便与小米建立了合作伙伴关系,声智科技依托自身在麦克风阵列、远场语音唤醒、端点检测及语音识别等方面的技术优势,助力小米陆续打造了小米AI音箱、小爱音箱mini、小沐智能马桶盖等多款智能家居产品,共同推动AI新时代。

 

随着智能语音交互落地场景的丰富,越来越多的用户开始享受智能家居产品带来的新体验,便捷高效的语音交互技术也日益凸显出重要价值,声智科技将不断保持远场智能交互的自主核心技术创新,为更多客户提供更加自然流畅的人机交互体验,共建万物互联新未来。



关于声智科技

声智科技成立于2016年5月,是融合声学和人工智能技术的平台服务商,主要提供SoundAI Azero智能操作系统和服务,以及深度结合应用场景的人工智能技术和产品解决方案,致力于实现“让机器更智能”的使命,达成“用科技改善生活”的愿景。声智科技是中关村前沿技术企业、中关村高新技术企业和国家高新技术企业,累计申请知识产权1000多项,参与5项国家标准制定,服务华为、小米、百度、腾讯、阿里、中国移动、中国联通、中央人民广播电台、联想、创维、宝洁、万科、奇虎360、金蝶、浪潮、国美等150多家知名客户和2000多万台智能设备,经过千亿次人机交互真实场景的规模验证,可为家居、办公、车载、会议、可穿戴等20+场景和设备提供高效的人机交互和智能决策能力。


声智科技拥有声学、语音、语义和图像等基础技术,以及分布式系统架构、云计算和边缘计算等应用技术,具体包括声学阵列、声学结构、声学处理(声源定位、回声抵消、噪声消除、混响抑制、波束形成、多人分离、语音增强等)、主动降噪、双工通话、声学探测、声学监控、语音唤醒、声纹识别、语音识别、语音合成、语言理解、情绪识别、人脸识别、文本识别、语音搜索、智能推荐、知识图谱、数据挖掘、虚拟数字人、实时音视频通信、多传感融合、多模态交互与深度学习框架等自主核心技术。




上一篇:声智科技×英飞凌战略合作:AI入口终端差异化竞争拐点到来,语音交互如何升级突破?
下一篇:声智科技携手炯为智能 助力中国联通打造首款自主带屏智能音箱
相关文章