百度世界大会发布一站式语音开发平台SoundPi!

11月16日,百度世界大会在北京盛大开幕。在这次大会上,百度度秘事业部总经理景鲲宣布DuerOS 2.0正式对业界开放。


早在2017年7月5日的百度AI开发者大会上,百度就发布了DuerOS开放平台即DuerOS 1.0。四个月后的今天,DuerOS2.0正式上线,这四个多月的时间里,百度DuerOS加速迭代,应者云集。此次大会开放升级的DuerOS 2.0,是基于DuerOS1.0的全面升级,包括升级的小度智能设备开放平台和全新发布的小度技能开放平台。


微信图片_20180525115647.jpg

 图为百度度秘事业部总经理景鲲


景鲲表示,作为人工智能时代的安卓,DuerOS已无处不在。人工智能时代,人机交互方式依旧在变革,AI操作系统需要不断学习和进化,DuerOS从1.0到2.0的全面升级,将会给用户和行业带来更好的“听清、听懂和满足”体验。


为了更好地唤醒万物,小度智能设备开放平台在技术能力、解决方案、平台体系三个方面进行了全面升级。技术能力的升级,包括准确快速的语音唤醒能力、流畅自然的语音识别能力、生动鲜活的合成语音以及更加智慧的AI能力。平台体系的升级,包括新增的物联网设备云、智能设备质量认证支持,平台体系更加丰富。


微信图片_20180525115652.jpg

图为度秘事业部副总经理葛行飞


而解决方案的升级,自然离不开更好的远场语音交互开发套件。会上,百度度秘事业部副总经理葛行飞在会上为我们详细介绍了小度智能设备开发平台的升级,并发布了更好的远场语音交互开发套件——SoundPi。


微信图片_20180525115656.jpg

图为SoundPi发布现场


SoundPi远场语音交互开发平台


SoundPi远场语音交互平台是一款软硬一体化的智能语音交互开发解决方案,集成全方向唤醒、声源测向、定向拾音、噪声抑制、混响消除、回声抵消、远场语音识别、语义理解、语音播报等多项技术。内置独家优化的DuerOS智能系统,提供生活服务、信息查询、设备控制、日程提醒、情感陪伴、链接服务等100多项功能与服务,可广泛应用于智能音箱、电视、冰箱、玩具、机器人、DOT、机顶盒、车载、可穿戴、远场遥控器等智能语音产品。


微信图片_20180525115659.jpg

图为SoundPi远场语音交互开发板


产品特点:
 

远场高识别 * 量产麦克风阵列技术
SoundPi集成波束成形(beam-forming)、噪声抑制技术、混响抑制技术、阵列增益技术、回声抵消等技术。复杂环境下,全方向精准定位、唤醒、识别。支持任意打断(free-cut)、双名唤醒(dual-wake)、一句连控(one-shot)


微信图片_20180525115702.jpg

图为SoundPi远场语音交互开发板


单板全集成 * 适应更多场景智能
SoundPi单板高度集成麦克风阵列、模块、主控芯片等组件,支持蓝牙、WiFi、Uart等串口协议。并且,提供HDMI、USB、OTG、3.5MM等丰富接口,广泛适用于音箱、电视、冰箱、玩具、机器人、车载、可穿戴,远场遥控器等多种场景及设备,为开发者的创造提供无限开发可能。


微信图片_20180525115706.jpg

图为SoundPi远场语音交互开发板


技能全覆盖 * DuerOS独家优化
 SoundPi内置独家优化的百度DuerOS“小度对话式人工智能系统”,为开发者提供通过自然语言对话的交互方式,实现设备控制、情感交流、信息查询、链接服务、日程管理等10大类目的100多项技能。


微信图片_20180525115709.jpg

图为SoundPi远场语音交互开发板


软硬全开放 * 开发更加简单快捷
SoundPi提供全栈式软硬件开放,兼容更多开发场景,支持用户自定义设计,帮助开始者快速实现产品开发,打造专属AI语音产品。


微信图片_20180525115711.jpg


图为SoundPi远场语音交互开发套件


强强联手,唤醒万物


SoundPi采用了声智科技(SoundAI)定制的远场高识别的量产麦克风阵列技术,内置SoundPi内置百度DuerOS独家优化的“小度对话式人工智能系统”。


微信图片_20180525115715.jpg

图为DuerOS生态合作伙伴

百度DuerOS是百度度秘事业部研发的对话式人工智能系统,它是百度全球领先人工智能技术的重要应用之一,借助百度的信息与服务构成的巨大生态DuerOS拥有海量数据,能通过自然语言完成对硬件的操作与对话交流, 为用户提供完整的服务链条。作为一款开放式的操作系统,DuerOS通过云端大脑时刻进行自动学习让机器具备人类的语言能力。
 
声智科技是一家专注声学前沿技术和人工智能交互的科技创新公司,致力于引领真实环境下更自由的人工智能交互体验,实现“听你所言,知你所想”的人机交互愿景。声智科技提供从软硬件到云服务的远场语音交互技术方案,以及从芯片模组、PCBA到工业设计的Turnkey产品方案,其回声抵消、噪声抑制、声源定位、混响消除、波束形成、远场语音唤醒、远场语音识别等技术在业界遥遥领先; 同时,声智科技与ARM、NVIDIA、Xilinx、Cypress、Knowles、百度、腾讯等著名企业深度合作,深耕智能家居、智能汽车、智能安防、智能金融、智能教育和机器人等行业,服务于小米、360、京东、联想、海尔、创维等著名品牌,共同提升远场语音交互的用户体验。
 
引领第三代人机交互方式的浪潮
 
1964年,美国人道格·恩格尔巴特发明了鼠标,图形用户界面随之出现,这种交互使用户摆脱了枯燥的机器语言,引发了人们探索计算机的热情;2007年1月,乔布斯发布的第1代iPhone开创了触屏时代,从此,人与机器的交互方式更加自由,科技的使用门槛再一次降低,逐渐融入生活。
2016年开始,AI的浪潮已经滚滚而来,我们都在期待一个人机交互更加自然的时代的到来,问题是,谁将成为新时代的领路人,再次刷新人们的生活方式?
 
作为人工智能的重要入口,智能语音的作用不容小觑,以echo为代表的智能音箱已经掀起了一波浪潮,那么,全新一代开发者将怎样不断的突破想象和现实的界限,开创更多的不可能,让我们拭目以待。


评论 (0)  •  2017-11-17  •  浏览 (145)