声智科技携手狗尾草,为AI虚拟生命新场景落地“带节奏”

突破次元壁画板 3.jpg

近日,狗尾草(Gowild)VLIS(AI虚拟生命交互系统)在政府、党建、地产、法院等实现新场景落地,例如三亚城郊人民法院、金科地产售楼中心、苏州某街道党支部……传统的公共场所注入实时互动的智能化服务,提供更加优质高效的服务。

 

搭载声智科技独家智能语音交互技术的VLIS,是狗尾草打造的一体化智能终端,以炫酷的全息视觉形象,通过语音+视觉+触屏相结合的交互方式,支持便捷化服务、广告植入、小程序联动等,可广泛应用于展览馆、地产售楼中心、党建空间、金融场所、公共设施空间、政企服务大厅、商业体等公共空间,实现深度互动、智能搜索、智能管理、接待服务、信息展示、数据分析、服务优化等功能。

 

声智科技为VLIS打造了基于4麦线形麦克风阵列的软硬一体化解决方案,搭配专属场景优化的远场声学处理、远场语音唤醒、远场语音识别等核心技术,为用户提供流畅自然的智能交互体验。

 

4麦线形麦克风阵列,复杂场景流畅交互

 

在服务大厅,为用户提供信息展示、智能问答;在售楼中心,为客户介绍产品信息、推荐服务……与目前市场上常见的智能设备不同之处在于,AI虚拟生命不仅可以执行语音指令,还可以与用户进行语音、视觉上的沟通交流,甚至可以实现情绪的定制输出。用户接触到的不再是冷冰冰的机器,而是具有鲜明性格和特色的虚拟人物,同时以语音这种用户友好的交互方式,可以最大程度上达到便利服务的目的,提升服务质量和形象。

 

但是,在公共空间中,噪声环境更加不可控。公共空间开放性大,设备多样,人员嘈杂,这些都给语音交互带来了困难。同时,交互过程中声源和麦克风距离较远、高度差偏大,实际环境中的环境噪声、人声干扰等多种噪声源,都极容易造成语音信号拾取的质量下降,给语音识别带来困难。

 

为此,声智科技根据场景交互需求提供了4麦线形麦克风阵列方案,结合波束形成、噪声抑制、声源定位等核心算法,有效保障复杂环境中流畅的语音交互体验。该方案较好地平衡了产品设计和用户体验的矛盾,既满足了180°交互角度需求,又保证了5米范围内较高的唤醒率和识别率,满足用户真实环境中无障碍的远场语音交需求。

 

场景化语音识别,特定场景准确解读

 

该方案让产品充分融入场景,实现虚拟形象实时互动,视觉语音交互融合。同时,支持前端交互服务、后端整合优化的闭环,不断提升服务质量,对于提升传统的政府党建、法院、金融等服务场景的效率具有极大的帮助作用。该设备能准确听清、听懂、回答用户提出的问题,其背后依托的是声智科技智能交互技术长期积累的成果。

 

该方案支持语音讲解、动态播报、语音查询、专业问答、自由问答,这就要求语音交互需配合不同的使用场景,尤其需要识别也需要根据特定场景进行优化,根据不同的场景进行特殊识别。

 

为此,声智科技独家研发了场景化语音识别技术,强化场景特点的训练优化,匹配不同的行业需求,使产品对用户指令的识别与解读更加合理高效。声智科技ASR算法的识别效果已达行业领先水平,支持各种垂直场景下的命令词识别,将误识别率控制在极低的水平内。

 

一站式解决方案,多行业应用前景广阔

 

科技的魅力在于渗透于生活的点点滴滴以提升人居质量,将日常中的公共服务、与当前方兴未艾的AI相结合,用拟人化的形象和表情代替冷冰冰的机器,全力打造友好的人机交互体验。

 

VLIS只是声智科技AI助理解决方案的一个应用案例,更深层次,声智科技提供完整的一站式AI助理解决方案,提供语音识别、语义理解、语音合成等多项人工智能技术,不仅可用于智能设备、儿童陪伴设备、屏幕互动设备、车载助理等多种场景下的虚拟形象打造,还可以应用于政务中心、服务大厅、营业厅乃至直播、短视频、企业虚拟代言人等各种垂直场景。支持丰富的形象/音色定制,包括各种2D/3D版本的卡通动漫以及真人风格形象,可以充分满足客户对于虚拟形象的个性化需求。

 

同时,声智科技AI助理解决方案设计灵活多样,可完美兼容原有系统,最大程度减少客户的开发工作量。还可根据客户需求提供不同的服务支持,打造高效率高性价比的解决方案。动作和语音完美协调配合,带来更加生动的沉浸式交互,催生新的互动生活消费模式。如在政府、党建、医疗等公共服务领域,可以代替传统的客服人员,以多样的服务方式充分提升基础服务终端的服务效率。而在在内容生产、直播等领域,则可以降低人员成本,缩短内容生产周期,充分释放从业人员的创造力。




 



关于声智科技


声智科技成立于2016年5月,是融合声学和人工智能技术的平台服务商,主要提供SoundAI Azero智能操作系统和服务,以及深度结合应用场景的人工智能技术和产品解决方案,致力于实现“让机器更智能”的使命,达成“用科技改善生活”的愿景。声智科技是中关村前沿技术企业、中关村高新技术企业和国家高新技术企业,累计申请知识产权1000多项,参与5项国家标准制定,服务华为、小米、百度、腾讯、阿里、中国移动、中国联通、中央人民广播电台、联想、创维、宝洁、万科、奇虎360、金蝶、浪潮、国美等150多家知名客户和2000多万台智能设备,经过千亿次人机交互真实场景的规模验证,可为家居、办公、车载、会议、可穿戴等20+场景和设备提供高效的人机交互和智能决策能力。


声智科技拥有声学、语音、语义和图像等基础技术,以及分布式系统架构、云计算和边缘计算等应用技术,具体包括声学阵列、声学结构、声学处理(声源定位、回声抵消、噪声消除、混响抑制、波束形成、多人分离、语音增强等)、主动降噪、双工通话、声学探测、声学监控、语音唤醒、声纹识别、语音识别、语音合成、语言理解、情绪识别、人脸识别、文本识别、语音搜索、智能推荐、知识图谱、数据挖掘、虚拟数字人、实时音视频通信、多传感融合、多模态交互与深度学习框架等自主核心技术。


上一篇:声智科技携手全志推出离在线混合语音模组,引爆行业AI升级之路
下一篇:声智科技助力Langogo打造媲美同传的翻译机,新产品正式进驻日本市场
相关文章