独家专利解析亚马逊下一个10亿美金业务：Echo 如何让谷歌眼红

IPR Daily，全球视野的知识产权新锐媒体

摘要

Echo 是一款能够通过语音控制的智能音箱，人们能够在房间的任何地方下达指令，来让它播放音乐、阅读新闻、购物甚至是叫一份披萨。这个业务在提案之初并不受重视，然而今天 Echo 成为了消费者的宠儿，超级碗广告的主角，亚马逊的“下一个十亿美元级业务”。

独家专利解析亚马逊下一个10亿美金业务：Echo 如何让谷歌眼红

2011年，当亚马逊硬件高级副总裁Dave Limp首次听闻关于 “Echo”这个产品的提案时，他第一反应是充满怀疑的。

2014 年，当科技媒体收到 Echo 的第一代产品时，他们都在吐槽“作为播放器来讲，它谈不上专业；而作为虚拟语音助手来讲，它又不及手机自带的虚拟语音助手方便。Echo 的未来发展前景还是非常令人担忧的。”

然而，今天 Echo 成为了消费者的宠儿，超级碗广告的主角，亚马逊的“下一个十亿美元级业务”。

为什么 Echo 能够在智能家居领域鹤立鸡群？

为什么总是手机？

独家专利解析亚马逊下一个10亿美金业务：Echo 如何让谷歌眼红

在传统智能家居领域，科技厂商希望消费者用手机来控制家庭里的各种电器与基础设备，但是这真的是消费者所想要的“智能”么？在他们看来手机不过是遥控器的代替产品罢了！而亚马逊则希望 Echo 成为现代家庭“管家”，消费者想要干什么，无需摸着找手机，只要随口说一句命令，Echo 就会为“主人”去操办了。

那 Echo 又是如何做到的呢？

独家专利解析亚马逊下一个10亿美金业务：Echo 如何让谷歌眼红

早在 2010 年前后为了与苹果的 Siri 及谷歌的 Voice 等语音识别系统竞争，亚马逊也开始了对语音识别投入了重金进行研发，但是亚马逊与前两者不同，手机领域并非它的主场，因此它将自己语音识别技术的结晶“Alexa”融入了一款名叫 Echo 的蓝牙音箱。

不过，语音识别技术作为智能家居的核心时总是会面对如对命令音频内容的识别和理解，语音的模糊性以及环境噪音干扰等问题，那么亚马逊申请的这些专利中藏着什么独门秘籍？让我们从亚马逊众多的语音识别专利中一探究竟。

如何听到主人的命令

独家专利解析亚马逊下一个10亿美金业务：Echo 如何让谷歌眼红

为了满足让用户可以在房屋的任何位置呼唤 Echo，亚马逊的工程师开发了一种由多个麦克风列阵及音频信号过滤系统构成的自动语音识别处理系统（ARS），ARS 系统中的麦克风列阵能够捕捉轻微的声音；而音频信号过滤系统，则能够辨别人类口音与诸如家电噪音等环境音，这两大独门“招式”让 Echo 拥有一对“顺风耳”在嘈杂的环境中辨别出主人的命令。

如何理解主人的命令

当 Echo 听到主人的“命令”后，它又该如何揣摩主人的意思去完成播放音乐，购买物品亦或者为主人打开某一件电器的任务？

独家专利解析亚马逊下一个10亿美金业务：Echo 如何让谷歌眼红

为此，亚马逊设计了一套关键词识别 (Keyword spotting) 人工智能技术让 Echo 将收到的“命令”音频拆分为多个字段，与云计算系统中储存的关键词模型逐一进行对比，与之最为匹配的部分“理解”为主人的真意。因此，只要你来一句：“Alexa, can you turn on the television?”

你家客厅的电视就会被打开了。

“哪一个书呆子小时候没梦想过有一台星际迷航中的超级电脑？”

Echo 只是一个智能音箱，但是 Echo 背后还亚马逊在云计算领域布局的超级服务器，因此 Echo 作为一个终端让世人看见以往只在科幻小说中看见的科技平台，科技服务于人类，未来又会如何？

独家专利解析亚马逊下一个10亿美金业务：Echo 如何让谷歌眼红

亚马逊已经将 Echo 作为了研发的重点，它必然会不断进步，同时更多的科技巨头也会跟进这个领域，从掏出手机到随口一声，也许明天只要你动脑想一想呢？

来源：PatSnap智慧芽

作者：陈子豪

编辑：IPRdaily王梦婷