AIIA公布智能音箱评级|声智科技远场语音交互技术实力获权威认可

20181016日,由国家发展和改革委员会高技术司,国家互联网信息办公室网络数据与技术局共同指导,中国人工智能产业发展联盟(AIIA)主办的AIIA人工智能开发者大会(苏州)在苏州国际博览中心落下帷幕。本次大会上正式发布了第一批智能音箱智能化评级结果。搭载声智科技自主研发的软硬件一体的远场语音交互技术,小度智能音箱、小米AI音箱等产品荣获中级智能证书。

1.jpg

此次评测,参照中国人工智能产业发展联盟(AIIA)组织起草的《人工智能产品智能化等级指标要求和评估方法第1部分:智能音箱》,将智能音箱智能化程度一共分为六个等级:无智能、自动化、初级智能、中级智能、高级智能、完全智能。测试了包括材料检查和技术测试两个维度的12项指标,涵盖基本信息和安全信息审查、语音唤醒准确率、误唤醒率、语音识别能力、智能交互能力、技能领域、响应速度、安全防护等方面。经过技术测试、企业答辩、专家评审会评分, 6家参评企业中,5家企业的智能音箱获得中级智能的证书。5款智能音箱产品中,三款产品采用了声智科技提供的智能语音交互技术与服务。


                         获奖企业及产品(排名不分先后)

企业名称

产品名称

百度在线网络技术(北京)有限公司

小度智能音箱

北京小米科技有限责任公司

小米AI音箱

北京猎户星空科技有限公司

小豹AI音箱

北京灵隆科技有限公司

京东叮咚mini2

上海证大喜马拉雅网络科技有限公司

小雅AI音箱




小米AI音箱

声智科技独家为小米AI音箱提供了产品系列中的定制环形6麦克风阵列、低功耗高性能远场语音唤醒和语音端点检测技术。

2.jpg

声智科技的算法优化能力一直处于行业领先地位,在智能音箱最复杂的场景,即立体声回声抵消过程中的打断唤醒,声智科技的算法复杂度也远优于市面同类技术,采用更轻量级的算法解决更复杂的问题。


而语音端点检测技术,是语音识别响应速度的决定性因素,声智科技通过对唤醒模型的不断训练,将机器应答时间做到了400~500毫秒的最佳体验速度


此外,声智科技的动态应答词匹配检测技术,将应答内容也做到了最大可能的人性化。小爱同学唤醒之后的随机应答词,包括我在等,均可以根据系统音量自动调整。



小度智能音箱

声智科技为小度智能音箱量身打造了全球首款3麦环型麦克风阵列,并提供了完整的远场语音唤醒和识别服务。

3.jpg

3麦环型麦克风阵列,构型灵活,不仅打破了音腔设计的局限,释放更多ID设计的空间,同时,还保持了成本和效果之间的良好平衡。


声智科技自主知识产权的宽场景高灵敏唤醒技术和低成本高容错唤醒技术,采用全新的唤醒模型,可在提升强噪环境下的唤醒率的同时,降低误唤醒率,即便在一致性和失真度非常大的情况下,也能够出色的保证用户体验的效果。


针对场景深度优化声智科技为小度智能音箱独家定制了儿童模式和极客模式可根据不同用户的用语习惯,进行自适应的样本训练和机器学习让人机交互更加智能化、人性化。例如:儿童生理上发育不够成熟,不善于掌握发音部位与方法,辅音发音分化不明显。而且,儿童发音单音重复较多,往往发出单个的、重叠的音,他们会说车车糖糖兔兔饭饭,而不说汽车兔子这样的儿童的交流方式,声智科技通过优化声学模型优化,打造了升级版的语音识别技术,使儿童识别准确率更高,更贴合儿童的语音交互习惯。 


声智科技全链条智能语音交互系统SVK

无论是声智科技为百度、腾讯、小米等客户打造的智能音箱,还是为华为、阿里等客户提供的智能机顶盒、智能电视、智能手机/平板、智能玩具、智能车载、智能安防等解决方案,都离不开声智科技自主研发的技术引擎——全链条智能语音交互系统SoundAI Voice Kit(以下简称SVK

4.jpg

SVK融合远场语音交互和远场实时通话,集成了声波配网、波束形成、声源测向、噪声抑制、混响消除、回声消除、语音唤醒、端点检测、语音识别、声纹识别、语义理解、语音合成、双工通话、自然语言处理等核心技术,可赋予智能终端设备以更加敏捷、人性化的语音交互能力。


极致仿生物行为的响应时间。SVK精准的远场语音唤醒、远场语音识别(Far-Field ASR)服务,面向垂直领域深度优化,平均准确率达96%以上。极大提升的识别率,确保了更人性化的语音交互速度体验,使产品从唤醒到内容的全链条响应速度达到全球领先的1.4S以内,同时,用户唤醒以后的机器应答响应速度则达到400~500毫秒的极致水平。


完美匹配场景应用的语音识别。远场智能语音产品具有场景特殊性,相对更加垂直,比如智能音箱的识别偏重于音乐和百科领域,而智能汽车的识别则偏重于地图和音乐领域。为了确保SVK的远场语音识别自如应对众多垂直领域的场景应用难题,并保证云端服务的稳定性和并发能力,声智科技采用端云强耦的技术架构,合理在端云分配计算能力,采用与Amazon AWS、阿里云等主流云计算平台相同的服务可靠性标准,SLA高达99.99%



关于声智科技

声智科技是全球领先的声学语音技术和语言智能服务科技创新公司,专注于声学前沿技术和人工智能交互,秉持听你所言,知你所想的技术理念,致力于通过不断引领真实环境下的人机交互体验,实现声音连接智能未来的使命,更自由的人机互联愿景。

 

声智科技主要提供从端到云的智能语音交互技术和服务方案,以及从芯片、模组、开发板到完整产品的智能语音应用方案。目前与百度、阿里、腾讯、ARMNVIDIAXilinxCypressBoschCadence等著名企业深度合作,深耕智能家居、智能汽车、智能安防、智能金融、智能教育、智能医疗和机器人等行业,服务小米、百度、阿里、华为、腾讯、联想、锤子、创维、金蝶、浪潮、中国移动、奇虎360、中央人民广播电台等客户,是国内服务用户最多、应用场景最全和覆盖地域最广的远场语音交互技术供应商。

 

了解更多,请访问声智科技官方网站http://www.soundai.com

评论 (0)  •  2018-10-17  •  浏览 (187)