声智新技术助力华为打造智能音箱Sound X,HiFi+智能突破声学想象

11月25日,华为MatePad及全场景新品发布会在上海举行,正式发布了全球首款双低音HiFi智能音箱——华为Sound X。华为与音响品牌帝瓦雷联合设计打造的Sound X,采用了声智科技领先的智能语音交互技术,完美解决了专业级HiFi音效、智能交互不能兼得的问题,开启高端智能音箱新篇章。

2画板 5.jpg

华为Sound X智能音箱,机身呈黑色,造型圆润,采用开放可见式低音单元设计,极具对称美感。回归音箱本质,提供真正的环绕立体声效果,华为Sound X完美实现了价格、音质和智能体验三者的完美平衡,将用户体验提升到新高度。

 

声智科技基于SoundAI Cimon声学软件和SoundAI Babel开放大脑,为华为Sound X提供了包括定向拾音、回声消除、声源定位、噪声抑制、混响消除、波束形成、语音唤醒等在内的核心技术,有效保障了智能音箱真实环境中5m范围内的流畅交互体验,满足用户在真实环境中无死角的远场交互需求。

 

澎湃低音,灵敏唤醒

 

华为Sound X 最为人津津乐道的特色之一便是令人震撼的澎湃低音,不仅音量4倍于同档位音箱,而且通过内部6个全频喇叭加外部双低音单元的独立设计,打造出现场级别的澎湃低音效果。同时,采用开放式低音单元设计,当音乐播放时,声波会带动喇叭产生有节奏感的震动效果,为用户提供听觉、视觉的双重体验。但震撼的低音效果同时也提升了智能交互的难度,大音量、双低音带来强烈的自噪声干扰,极大地提高了声学处理的计算量。

 

2画板-2.png

对此,声智科技通过独家优化的回声消除算法加以解决。在目前市场上已有的产品中,回声消除已经可以有效应对中高频段的自噪声问题,但对于低频的处理效果往往难以让人满意。尤其针对华为Sound X低音过重的特点,通常的处理方式更是难以奏效,经声智科技独家优化的回声消除算法,可完美解决自噪声中低频部分难消除的问题,从而实现灵敏唤醒、精准识别。

 

而且,声智科技回声消除算法还具有非常优秀的自适应能力。针对Sound X根据环境位置不同自动切换音效的特色,可兼容多种音效,自动适应不同音效场景下噪声环境的变化,支持随时打断、随时唤醒。

 

定向拾音,及时响应

 

在真实使用环境中,5米范围内呼唤“小艺小艺”,华为Sound X都可以及时准确地响应用户指令。无论是播放音乐,还是询问百科、播放儿童读物,又或者是进行智能家居控制,声智科技提供的定向拾音技术都可为用户提供一呼即应的极致唤醒体验。即便在播放大音量音乐或多人聊天场景下,定向拾音技术也可以保障产品实现5米范围内全方位捕捉声音,自动识别说话者方位,及时响应反馈。

 

2画板-3.png

对于智能音箱而言,音质的提升,不能以牺牲智能体验为代价。声智科技为华为Sound X独家提供的降噪唤醒技术,以声源定位、波束形成、噪声抑制、混响消除等算法为核心,在嘈杂环境下依然可以准确识别用户指令。通过优化波束形成、声源定位等核心算法以提供优质的定向拾音技术,屏蔽来自环境中的噪声干扰,提高语音信号处理质量。因此,保障了华为Sound X在各种复杂场景下,依然具有很高的唤醒率和识别率,其远场拾音性能达到业内领先水平,具有很好的场景适应性。例如在多人聊天场景中,该技术可根据说话人的语音特点如距离、语调、语速等,进行相应处理,保障产品支持精准定向的唤醒识别服务。

 

同时,声智科技还提供了独家优化的唤醒模型,采用新的算法策略,有效平衡真实使用场景中的高误唤醒和低唤醒率问题,解决“难唤醒”、“乱唤醒”的状况。从而确保在复杂的噪声环境中,华为Sound X依然可以提供优质的智能交互服务体验。

 

空间感知,随声而动

 

华为Sound X另一重要突破在于,无论将其放置于房间哪个位置,均可以根据音箱所处位置进行音效的自动调节。如当音箱位于房间中间时,自动营造出360°均匀声场;当音箱靠近墙壁放置,则自动模拟出5.1家庭影院全景声音效。这一优秀的空间智慧感知能力背后也离不开声智科技提供的降噪唤醒技术。处于不同的空间位置,会面临不同的噪声环境,既包括空调等平稳噪声,也包括人声交谈等非稳态噪声,还需要面对不同环境下造成的混响的差异。


2画板-4.png

在这种情况下,为保证Sound X稳定高质的智能交互体验,就要求降噪唤醒等核心技术具有非常优秀的适应能力以及兼容性。声智科技独家优化的智能交互技术便有效解决了该问题,通过特殊处理方式,最大程度地减少了环境变化造成的智能交互体验效果的下降。而且,声智科技已经突破了常见的均匀声场和麦克风顶制的算法约束,通过Inverse Array(倒置麦克风阵列)、Vibrated AEC(动态声场回声消除)、Penetrated DOA(穿透式波达方向估计)、OpenAEC(开放声场回声消除)、TVNS(TV Noise Suppression)等独有技术,释放出智能产品形态的更多可能,而这些技术也已经在腾讯智能机器人、阿里天猫精灵魔盒等多个产品中得到了量产验证。

 

华为Sound X智能音箱搭载声智科技领先的智能交互技术,实现了音效和智能体验双突破。此外,声智科技可提供包括一站式智能音箱解决方案,包括远场声学处理、远场语音唤醒、远场语音识别、远场双工通话、自然语言理解、自然语音合成等在内,以量产验证的成熟方案,为客户提供优质服务。

 

不仅如此,声智科技还提供SoundAI Azero智能操作系统,内置麦克风阵列、远场语音唤醒、远场语音识别、自然语言处理、远场语音合成、声纹识别等算法,默认集成了信息查询、影音娱乐、IOT控制等200+项常用技能与服务,经过了数十亿次人机交互真实场景的规模验证,可为家居、办公、车载、可穿戴等20+场景和设备提供高效的人机交互和智能决策能力。并且,声智科技可为垂直场景客户提供一站式的行业解决方案,例如智慧教育、智慧金融、智慧文旅、智能家居等。

 

自2018年声智科技与华为第一次合作以来,双方强强联合推出了华为AI音箱、华为荣耀YOYO智能音箱、华为AI音箱mini等多款产品,不断推动技术和场景落地突破,获得了市场和消费者的高度认可。

 

 

关于声智科技

声智科技成立于2016年5月,是融合声学和人工智能技术的平台服务商,主要提供SoundAI Azero智能操作系统和服务,以及深度结合应用场景的人工智能技术和产品解决方案,致力于实现“让机器更智能”的使命,达成“用科技改善生活”的愿景。声智科技是中关村前沿技术企业、中关村高新技术企业和国家高新技术企业,累计申请知识产权1000多项,参与5项国家标准制定,服务华为、小米、百度、腾讯、阿里、中国移动、中国联通、中央人民广播电台、联想、创维、宝洁、万科、奇虎360、金蝶、浪潮、国美等150多家知名客户和2000多万台智能设备,经过千亿次人机交互真实场景的规模验证,可为家居、办公、车载、会议、可穿戴等20+场景和设备提供高效的人机交互和智能决策能力。

 

声智科技拥有声学、语音、语义和图像等基础技术,以及分布式系统架构、云计算和边缘计算等应用技术,具体包括声学阵列、声学结构、声学处理(声源定位、回声抵消、噪声消除、混响抑制、波束形成、多人分离、语音增强等)、主动降噪、双工通话、声学探测、声学监控、语音唤醒、声纹识别、语音识别、语音合成、语言理解、情绪识别、人脸识别、文本识别、语音搜索、智能推荐、知识图谱、数据挖掘、虚拟数字人、实时音视频通信、多传感融合、多模态交互与深度学习框架等自主核心技术。

上一篇:声智科技助力Langogo打造媲美同传的翻译机,新产品正式进驻日本市场
下一篇:声智 × 小米 用这两款产品让你的生活质量再提升N倍
相关文章