与小米双赢—SoundAI“硬科技”完美结合小米AI音箱

7月28日,小米新品发布会如期而至,除了先前早已曝光的小米5X新机和MIUI9,这次还发布了一款小米AI智能产品,那就是小米公司联合创始人及小米电视负责人王川先生亲自登场为大家介绍压轴新品——“小米AI音箱”。
 


微信图片_20180525114631.jpg

图为小米发布的新品:小米AI音箱


人工智能行业,“有多少人工就有多少的智能”。王川先生介绍了小米AI音箱其实包含了有很多的技术,里面都凝练了大量工程师的心血,除了小米的工程师,也包括了很多第三方的工程师。


为了把音箱做到体验最好,小米拜访了全球大量的公司,严选每一个技术、产品供应伙伴,在每个环节上都力争用全球最好的技术来展现。川总在现场感谢了每一个合作伙伴,其中特别提到了声智科技(SoundAI)。作为小米AI音箱重要的合作伙伴,声智科技为小米AI音箱提供了领先的麦克风阵列和唤醒技术方案,包括Beamforming,Dual-wake,Free-cut和One-shot。



微信图片_20180525114635.jpg

图为小米王川介绍合作伙伴声智科技


如何推出一款成功的智能音箱产品?
其实,国内2014年就有公司发布过智能音箱,但却远未取得亚马逊Echo那样的成功,因此我们必须正视一个根本性的问题:智能音箱到底难不难做?如果难做为什么很多厂商持续推出类似的产品,如果不难为什么此前巨头推出的产品却无法成功?



微信图片_20180525114639.jpg

图为国内智能音箱的对比分析



答案其实并不复杂,照猫画虎不难,但成为齐白石那样的画家却很难。隐藏在这背后的实质是,“能做”和“做好”之间隔着的是一种硬功夫。任何人都不应该忽视亚马逊在Echo上已经花了接近七年的时间这一基本现实。在这里,“能做”虽然可以成为一种噱头,但并没有真正的商业意义。


作为一台智能音箱,它必须在交互的精度上突破某个界限,否则对于用户而言就是一款不能用的产品。而为了达成这种精度,“听力”是其中至关重要的一环。小米联合创始人王川在发布会上特别来致谢的声智科技(SoundAI)就是一家“领先的麦克风阵列技术公司”,在此次“小爱同学”的塑造工作中,负责的就是赋予她灵敏听力的任务。


为了让小爱同学反应快、听得准,本次,SoundAI为小米智能音箱提供了硬件与算法的双重支持。

硬件部分,小米音箱采用了声智科技环形6麦阵列,拥有全方向唤醒、声源定向、定向拾音、噪声抑制、混响消除等功能,能满足用户在语音交互领域的全部需求。


除了麦克风阵列,本次SoundAI赋予小爱同学的一些其他功能也让人眼前一亮,这些功能让小爱同学与众不同:双名唤醒(Dual-wake),即唤醒词不再是单一的一个,音箱可以拥有两个名字,使用任意一个名字都可以将其唤醒并进行无差别的操作。如用户叫“小爱同学”或者是“小米电视”都可以将音箱唤醒。这样的设计与改进对于智能音箱的功能拓展与实现智能家电之间的联动是一个良好的开始)


任意打断(Free-cut)。当音箱自身被唤醒后进入等待识别状态,很多音箱会有一段间隔才能再次被唤醒,这很不方便;而Free-cut技术可以让音箱任意时刻立即响应新的唤醒,并终止当前任务执行新的任务,这就实现了连续重复唤醒,而无需等待机器间隔,即随叫随应,和人类习惯完全一样。当然,这种技术也优化了正执行任务比如播放音乐(即使大音量)时候的唤醒性能。


一句连控(one-shot),采用“唤醒词+语音语义识别”一体化方式,实现唤醒词与语音操控之间无缝对接,用户叫了设备的名字后无需等待设备应答就可以直接说出命令,比如其他智能音箱要等设备说“诶”、“我在”等之后才能说出命令),小爱同学因此而变得更加灵动、懂你。
 
在AI浪潮一浪猛过一浪的今天,大家都在为能在即将到来的AI时代占有一席之地奋力而战,尤其是现在被很多人看好的、有望变身为未来智能语音交互入口的智能音箱,国内各大巨头接二连三地发布自己的智能音箱,音箱浪潮高涨空前。

但商业本身必然会回归其既有的规律,交互体验、内容、定价最终都会决定你在这个品类上的胜负。小米的入局虽然看似为竞争增加了更多的变数,但小米+声智科技这次其实已经把体验、价格打到极致,相信很多友商会很快感受到其中的压力,变数未必就是变数。
 
声智科技(SoundAI)是一家硬科技公司


目前,SoundAI这家公司此前就曾与360合作共同推出大小水滴摄像头、儿童故事机等,还与国外ARM、NVIDIA,Xilinx,Rockchip,Cypress等公司建立合作关系。不久前,SoundAI携手百度,在百度的DuerOS发布会上面向产品制造商推出了基于DuerOS的一体化远场语音交互解决方案。如今,SoundAI又助力小米,通过自身技术实力推出智能音箱“小爱同学”,在这场风浪中,SoundAI可谓是乘风破浪,披荆斩棘。

这家公司从成立至今,仅仅过了一年多的时间而已,为什么会有飞速的成长?为什么会受到巨头青睐?——成长或者是成就都源于专注。

2016年4月,当时的语音交互之争只是初见端倪,出身于中科院声学所的声智科技团队仔细的评估了未来语音交互行业的发展前景,并结合自身的技术优势,不断的对声智科技的技术方案、算法产品做深入的优化调整,主打声学感知技术与人工智能技术的融合,在AI时代最大程度发挥其人工智能交互方面的所长。


目前,在声学技术方面,SoundAI提供从芯片、模组、OS到云服务的一系列交互解决方案,其行业领先的例如回声抵消、噪声抑制、声源定位等技术使麦克风不再是一个简单的收音工具,它能做到让人不需要贴近设备就能与之交流,通过麦克风阵列前端处理法,对目标说话人的声音进行远场增强并匹配远场语音识别,使得即使距离麦克风5米远仍能准确识别语音命令。


很多人可能并没意识到声学算法和经常说的其它各种算法的差异。很多经典数值和非数值算法,甚至包含深度学习本身更多属于Computer Science领域。为了做好这些算法科学家们并不需要反反复复的做实验,采集数据,修改硬件参数。但声学算法则通常横跨两个领域,既要用到CS中各种算法(比如唤醒的实现),也要在实验室中反复的测试打磨。也正因此,这个领域才特别需要一些像声智科技这样的硬科技公司。


一旦SoundAI这种硬科技公司把远场交互的体验推过某个限度,远场交互的拓展势必不会只局限于智能音箱,今后,智能安防、车载娱乐、智能医疗、智能玩具、智能家居、虚拟现实都将会是它的主场。



微信图片_20180525114646.jpg

图为声智科技业务领域


而语音会加速人机交互方式的变革,可能会重新定义很多消费电子,如果将来所有消费电子都支持语音交互,那这个市场将会十分庞大,基本上会在全球范围内重构整个产业链条。


SoundAI致力于用自己的硬实力将“能做”变成“做好”,在将来一定会实现从技术到产品的落地,给广大用户带去更良好的用户体验。


评论 (0)  •  2017-10-27  •  浏览 (112)