声智 × 小米 用这两款产品让你的生活质量再提升N倍

快节奏的日常生活、繁琐的日常事务、巨大的工作压力,总是围绕着都市奋斗着的人们。偶尔难得有机会放松的假期,就更显得弥足珍贵。而近年来智能产品的爆发式增长,则让人们可以享受到更加舒适轻松的生活,从家居到出行,“动动嘴就能掌控一切”。

 1新闻中心小.jpg

11月,搭载声智科技智能交互技术的两款小米智能设备——米家激光投影仪、米家翻译机重磅亮相。声智科技再度助力小米打造新款AIoT生态链产品,提供流畅自然的人机交互体验,让人们的生活质量再度获得提升。

 

米家激光投影仪,独创轻量级唤醒模型

1.jpg

11月19日,在小米开发者大会上,搭载声智科技Cimon声学软件的米家激光投影仪正式发布。米家激光投影仪,一方面大幅提升了亮度、画质、音效等,另一重要特色便是支持远场语音控制,远程唤醒无需遥控,智能互动自由观影。作为同等价位下配置最高的产品,支持开机即为投影仪,关机即为智能音箱,不仅可以享受影院级巨幕观影体验,而且可以体验IoT控制、信息查询等多种服务。

 

声智科技为米家激光投影仪提供了SoundAI Cimon声学软件技术支持,包括波束形成、OpenAEC(开放声场回声消除)、语音唤醒、VAD(语音端点检测)等。由于投影仪播放高清视频过程中需要将CPU的运行资源绝大部分用于视频处理的特点,要求声学处理算法需要在CPU占用少、算力低等诸多高要求的情况下,为用户提供流畅的智能交互体验。

 

为此,声智科技为米家激光投影仪提供了轻量级唤醒模型,在优化算法和模型的基础上降低CPU占用率。通过适配Android系统底层的缓存优化及针对硬件进行加速,在保障流畅度的基础上也减少了功耗。同时,通过独家优化的降噪唤醒技术实现了无障碍的交互体验,以OpenAEC技术为例,主要是为了解决弱参考信号或者无参考信号等更为复杂场景的回声抵消(自噪声抑制)问题。声智科技针对此类产品交互特点独家研发的OpenAEC技术,大幅提升远场语音唤醒的准确率,实现全方向的精准唤醒,并减少误唤醒干扰,兼顾误唤醒率。

 

声智科技智能投影仪解决方案,基于声学和人工智能领域技术优势,搭配深度结合应用场景的麦克风阵列模组方案,支持5米内智能语音交互,可提供IoT控制、影音娱乐、信息查询、音视频实时互动等功能服务,适用于家居生活、商务办公等多个场景中,打造人性化智能服务体验。

 

米家翻译机,开创性6麦克风阵列

2.jpg

11月26日,小米米家翻译机正式上线售卖,声智科技为其提供了基于L形6麦克风阵列的软硬一体化方案,搭配专属场景优化的噪声抑制、声源分离等核心技术,支持远场双向拾音,可自动判断说话人方向,自动断句、自动翻译并显示播放翻译结该款翻译机配备4.1寸大屏,支持18种语言互译,可识别170余种语言,实现AI自动翻译。

 

与市场同等产品大多采用的是单麦克风、双麦克风、4麦克风不同,而米家翻译机采用声智科技独家研发提供的L形6麦克风阵列。6麦克风的配置识别距离更远,识别效果更准确。同时L形的阵型设计,配合声源定位、噪声抑制等算法,可以准确识别出对话人的语音,自动屏蔽机身两侧噪音干扰,即便再嘈杂的环境也能完美拾取声音进行高清降噪翻译。

 

米家翻译机即便在嘈杂的环境中,也无需单独手动按键干预,这样可以为让交流双方已最自然的方式聊天,在交互上更方便,在交流上更畅通。声智科技核心技术支持使得翻译机可以精确判断交流双方何时发言,改变了以往人们的跨语言交流方式。无论是在什么样的环境中,都可以为使用者提供最舒适的使用环境,以最舒适的使用习惯,获得最准确的唤醒率和最灵敏的唤醒速度体验。

 

自2017年起,声智科技便与小米建立了合作关系,双方合作从智能音箱拓展到智能马桶盖、智能电视等多种产品品类,陆续打造了小米AI音箱、小米小爱音箱mini、小米小沐智能马桶盖、小米壁画电视等产品。声智科技凭借在智能语音交互领域的技术积累,助力小米IoT战略布局,为更多的智能终端提供远场语音交互能力。

 

从家居生活到户外出行,从文娱教育到职场工作,AI正在深刻改变着众多行业,声智科技的智能语音交互技术也在越来越多地充当着催化剂,推动传统行业智能化升级,提高生活质量,释放更多创造力。

 


关于声智科技


声智科技成立于2016年5月,是融合声学和人工智能技术的平台服务商,主要提供SoundAI Azero智能操作系统和服务,以及深度结合应用场景的人工智能技术和产品解决方案,致力于实现“让机器更智能”的使命,达成“用科技改善生活”的愿景。声智科技是中关村前沿技术企业、中关村高新技术企业和国家高新技术企业,累计申请知识产权1000多项,参与5项国家标准制定,服务华为、小米、百度、腾讯、阿里、中国移动、中国联通、中央人民广播电台、联想、创维、宝洁、万科、奇虎360、金蝶、浪潮、国美等150多家知名客户和2000多万台智能设备,经过千亿次人机交互真实场景的规模验证,可为家居、办公、车载、会议、可穿戴等20+场景和设备提供高效的人机交互和智能决策能力。

 

声智科技拥有声学、语音、语义和图像等基础技术,以及分布式系统架构、云计算和边缘计算等应用技术,具体包括声学阵列、声学结构、声学处理(声源定位、回声抵消、噪声消除、混响抑制、波束形成、多人分离、语音增强等)、主动降噪、双工通话、声学探测、声学监控、语音唤醒、声纹识别、语音识别、语音合成、语言理解、情绪识别、人脸识别、文本识别、语音搜索、智能推荐、知识图谱、数据挖掘、虚拟数字人、实时音视频通信、多传感融合、多模态交互与深度学习框架等自主核心技术。

上一篇:声智新技术助力华为打造智能音箱Sound X,HiFi+智能突破声学想象
下一篇:声智科技SoundPi Cube智能开发魔盒:让开发者快速构建AI语音产品
相关文章