腾讯智能机器人妲己上线 声智携新技术与你相约星际

2019年腾讯全球数字生态大会如期在云南昆明举行,这是腾讯自去年战略升级后打造的规格最高、规模最大的行业生态大会,本次大会以“共创数字纪元”为主题,集聚众多行业领袖、技术领军人物和国际知名数字经济学者,共同探讨在云计算、AI、5G等科技推动下的数字经济发展趋势和产业互联网发展路径。

微信图片_20190521150016.jpg

(图片来源:网络)

本次大会上,腾讯新一代王者荣耀智能机器人——“星空魅影”妲己正式上线开启预售!这是继王者荣耀智能机器人吕布、孙尚香、刘备之后,全新升级的2.0具象化智能机器人系列首次面市

 

 “请尽情吩咐妲己,主人”,有趣的灵魂和可爱的模样缺一不可,搭载声智科技远场智能交互系统SoundAI Azero的智能机器人妲己,在延续吕布、孙尚香、刘备多项绝技的基础上,从游戏里天真可爱的 “魅力之狐”,完美变身成为生活中能听会说的实时百科、贴心助理和最佳玩伴,不仅实现了对正版游戏角色形象和声音的高度还原,还可为玩家提供出色的智能交互体验,智趣横生。

001.jpg

声智科技基于远场智能交互系统SoundAI Azero为腾讯智能机器人独家定制了软硬一体化的穿透式远场语音交互解决方案,采用6麦环形麦克风阵列设计,匹配波束形成、噪声抑制、回声消除、混响消除等前端声学技术,支持SSP、SSA、Free-cut、One-shot等功能。通过独家研发的6麦环形麦克风阵列(Microphone Array)和穿透式波达方向估计(Penetrated DOA)技术,以及动态声场的回声消除(Vibrated AEC)等独家定制的AI声学算法,赋能腾讯智能机器人,无惧噪声干扰,随时随地响应用户指令。

 

6麦环形麦克风阵列,优化拾音效果

腾讯智能机器人特殊的造型结构,以及扬声器、麦克风的声学结构设计,均区别于常规智能语音设备(如智能音箱、机顶盒等),对语音信号的拾取提出了更高难度。为打造更出色的用户体验,扬声器和麦克风均被设置于人偶底部,而不同于常规将麦克风阵列置于顶端、扬声器位于底部的“上听下说”且“听说一体”的圆柱或立方体的中空音腔结构。这种结构设计,会使得麦克风在拾音过程中受到人偶部分的声反射和非线性声反射的干扰,增加了前端降噪和信号处理的难度。

同时,为使得腾讯智能机器人可以360°自由旋转随时定位玩家的声源位置,在底座置入了旋转电机,而且电机距离麦克风较近。当人偶进行大角度旋转时产生的电机噪音,对麦克风阵列的拾音效果也会造成非常大的干扰。

FC6DE003-FA3D-4ab2-B470-1D00F823C144.png

为此,声智科技研发了6麦环形麦克风阵列设计,通过算法优化进一步增强了对声音信号的拾取和处理能力,有效抑制自噪声和环境噪声,实现在真实应用场景中3-5米的无障碍智能交互,360度全方位均可以做到随时唤醒、随时打断。

 

穿透式波达方向估计,提高声源定位准确性

腾讯智能机器人的人偶身体处于麦克风阵列正上方,成为语音信号拾取时的直接障碍物。不规则外形的人偶会造成大量的声反射和声衍射信号,导致多径传播情况的普遍出现,极大地影响了腾讯智能机器人的声源定位功能。

00321.jpg

为此,声智科技研发了穿透式波达方向估计(Penetrated DOA)技术,通过优化升级算法,实现即便在噪声干扰大、强混响、多反射的条件下,也可以实现360度的全方位测向,将定位误差控制在10度以内,随时随地响应“主人”召唤。

 

动态声场回声消除,打造无障碍唤醒

 相较于常规智能音箱而言,腾讯智能机器人将麦克风和扬声器同时设置在人偶底座,内部声学构造上麦克风阵列与大音量扬声器相距很近,提高了人机交互过程中的噪声抑制、回声消除的难度。同时,为更好实现立体声效果,妲己采用了高灵敏度全频扬声器,用澎湃低音、柔润高音震撼用户的每一根神经。当发声器件与麦克风的距离位置很近时,对麦克风的声源测向会产生极强干扰,从而影响到人偶在声源定位时旋转角度的精确性。

00421.jpg

为此,声智科技研发了动态声场回声消除(Vibrated AEC)技术,搭配混响消除、宽场景高灵敏语音唤醒等专属声学AI算法,在保护主方向语音不失真的前提下,去除环境中的非稳态噪声以及空调等其他平稳噪声干扰,自适应抑制混响问题。同时,这一技术还可以去除由于房间混响造成的语音拖尾,提高语音清晰度,解决弱参考信号或无参考信号等复杂场景中的回声抵消问题,在双工语音交互(Double Talk)的情况下仍然鲁棒。从而,有效提升了音乐状态或语音合成(TTS)状态下的唤醒率,以及在5米内的噪音环境下的远场语音唤醒和识别率。

 

声智科技自2017年成为腾讯人工智能生态合作伙伴以来,依托自主研发的远场语音交互技术,先后为腾讯打造了腾讯智能音箱、智能车机系统以及智能机器人吕布、孙尚香等产品,助力腾讯深化在家居、车载和机器人三大领域的人工智能布局与落地。

 

文创与科技的魅力交相辉映,IP+AI的实力相得益彰,声智科技依托自主研发的远场智能交互系统SoundAI Azero,可为客户个性化智能机器人整机解决方案,让更多深受大众喜爱的IP形象进入日常生活。同时,声智科技智能机器人整机解决方案除了家居场景以外,还可以落地到智慧出行、智慧酒店等多个场景中,为用户提供更多增值服务和体验。

 

随着智能语音交互落地场景的丰富,越来越多的用户开始享受智能产品带来的新体验,语音交互技术的潜能和应用价值也将进一步释放出来。声智科技将继续专注于声学语音技术和场景语义技术的应用落地,携手生态合作伙伴,加速产业链的智能化升级,打造更自由的人机互联世界。

 

 

关于声智科技

声智科技是全球领先的远场智能交互系统提供商之一,专注于声学语音技术和场景语义技术,致力于通过不断引领真实环境下的人机交互体验,实现“用声音让生活更智能”的使命,达成未来“更自由的人机互联”的愿景。声智科技主要提供SoundAI Azero操作系统和开放平台服务,以及深度结合应用场景的人工智能技术和产品解决方案,并拥有声学矢量传感、声学阵列芯片、声学结构设计、远场声学处理(回声抵消、噪声抑制、声源定位、混响消除、波束形成等)、远场语音唤醒、远场声纹识别、远场语音识别、远场双工通话、场景语义理解、自然语音合成、超远场声学监控、局部场语音识别、分布场语音交互、深度学习与小样本学习、智能搜索与个性化推荐等自主核心技术。

评论 (0)  •  2019-05-23  •  浏览 (95)