`

Siri究竟牛在哪里?深入解析苹果的人工智能助理

阅读更多

上周二,苹果发布了“新一代的”iPhone 4S,宣布将启用一项新的语音识别系统:Siri。很多人或许还没有明白Siri的重要意义,Cult of Mac网站对Siri进行了一番深入的解析,看过此文或许能让你更有理由相信,人工智能已经走进我们的生活。 



  说到 Siri,这是一道硬菜。可在 Android 上,这个功能一年前就有了,苹果不过是想在这方面“不输他人”,而且其功能也并非如此强大。对吧? 

  错。除了它确实是一道硬菜以外,其他的都错。 

  其实,Siri 是十年内移动平台上最重要的事件之一。 

  对 Siri 持否定看法的人一般会分成两个阵营:一边会说它没什么了不起的;另一边会说 Android 上之前已经有了。这两方的说法都不正确。 

Siri 的意义相当重大 

  我们不妨先从 Siri 的血统说起。Siri 直接发端于史上最大的人工智能项目:五角大楼的 CALO 项目。CALO 是“Cognitive Assistant that Learns and Organizes”的缩写(会学习和组织的认知助理),这个项目汇聚了全球人工智能方面的顶尖科研人员。 

  整个 CALO 计划的带头人名叫 Adam Cheyer,他现在也是苹果 iPhone 团队的工程总监。 

  在《麻省理工技术评论》的采访中,Cheyer 说 CALO 早已开始探索如何把“对话、自然语言理解、视觉、演说、机器学习、制定计划、理性思考、服务代表全部融合到一个模仿人类的助理中,帮助人们完成不同的事情。” 

  他形容说 Siri 计划就是寻求在一件消费产品中做同样的事情。其实,在过去的四年里,Cheyer 和他的团队一直在钻研如何优化 CALO,使其能够在一台强大的移动电话中发挥效用,每天都能被成千上万的用户使用。在过去一年半中,他们把主要精力放在 Siri 技术和 iOS 及其应用程序的整合上。 

  它不是单纯的“声音识别”。它是人工智能。当人工智能进入了你的手机,难道意义还不够重大? 

Siri 和 Voice Actions 是两码事 

  Android 系统的 Voice Actions 也是一项伟大的技术,并已经被许多 Android 用户所熟知和使用。但说真的,它和 Siri 不是同一个层面的产品。 

  Voice Actions 提供了非常坚实可靠的声音识别引擎,它的高识别度把曾经一度流行的语音识别工具都比了下去。 

  不过,和过去的所有语音命令系统一样,它要求你说的话严格符合一系列特定的语法,否则它就无法理解。

  Siri 和以前公众使用过的所有产品都不相同。你说的话可以和你想表达的意思在字面上毫不相干,从严格的技术上看也似乎是文不对题,但 Siri 会根据上下文、人类历史以及能够理解一般人类语言的人工智能去分析,并在多数情况下领会你的意思。 

  打个比方,你想小睡一会,并准备上个闹钟,只需要说“20 分钟后叫醒我”。如果你想查阅后面的日程安排,你可以说:“我今天接下来都有什么事?” 

  这些语句中既不包括会用到的应用程序名称,也不包括所需数据的名称。Siri 仍然能够理解。 

  对人类而言,这些句子再平常不过了。但要让机器去理解这些变化多端的棘手词汇,就是人工智能的圣杯了。 

  而更加人性化的特点是,一旦你开始和 Siri 进入一段对话,它甚至能理解许多含义模糊或者引申的语义。比如,你可以问它:“步行范围内有没有什么顶尖的意大利餐馆?”如果 Siri 查询后回答“没有”的话,你可以说:“那墨西哥的呢?”Siri 会将你的这个问题连同上文的“顶尖的餐馆”和“步行范围”一道进行理解。 

  Android 的 Voice Actions 做不到这样的事情,因为它是一个声控命令软件,而并非人工智能。 

  Siri 有时会为你显示网页搜索的结果,有时能替你执行一些操作,有时能够直接控制 iPhone 里的应用程序。 

  而且 Siri 同样能够回答问题,这要归功于它整合的 Wolfram-Alpha。你可以随机提问:“30 英里是多少公里?”,“巴黎现在几点?”,“钢琴上有多少个八度?”,或者“天空为何是蓝色的?”Siri 能够直接回答这些问题。不是唰地显示一个网页。就是回答你的问题。 

关于 Siri,重中之重是什么? 

  从历史和文明的角度来看,关于 Siri,最伟大的事情并非人工智能本身。而是苹果通过 Siri 把人工智能带进了现实生活中。 

  理由就是:苹果将 Siri 做成了 iPhone 的一个核心组成部分,并且让它作为手机使用的主流,让每个用户都觉得除了使用很方便之外,更想时时刻刻都尝试使用它。 

  提到“主流”,我指的是捡起那些被人类文明边缘化了的东西,并使其成为大量人群每日生活的一部分。现在,Google 出品的 Voice Actions 不得不面临被边缘化的境地。一般人甚至都没听说过它。 

  Siri 会成为主流的。人们会逐渐熟知它,甚至包括非 iPhone 用户。 

  爱迪生并不是发明灯泡的人。他是通过产品设计和市场营销,将灯泡变为主流的人。 

  福特并不是发明汽车的人。他是通过控制成本和市场营销,将汽车变为主流的人。 

  我们总是记住那些将事物变成主流的人,因为正是这些人和公司让科学技术真正融入每个人每天的生活。于是,说起灯泡,它就溯源至爱迪生;说到汽车,它就溯源至福特。 

  Google 的 Voice Actions 并非人工智能,虽说它确实让用户省去了打字输入、触摸操作的工序,只需要使用声音去控制机器就可以完成一系列事情。但是,Voice Actions 最终没有让声控成为主流。或许一些极客们会学着使用它吧。 

  然而,妈妈们会选择 Siri。 

And One More Thing(还有一件事) 

  iPhone 4S 也许会成为第一款支持蓝牙4.0 的手机,这项技术可以降低能耗,同时可以做到一件非常特别的事:唤醒设备。 

  如果把 Siri 和这项无线技术结合起来,其使用范围就更加广泛了。例如,可以想象你戴着一款“超长待机”手表,它会一直睡眠,你触摸它才会显示时间,或者在 iPhone 收到短信时,手表会被 Siri 唤醒。你如果要和 Siri 交谈,只需要对着手表说话就可以了,甚至连手机都不用掏出来。 

  同样,可以试想一下,有这么一款桌面麦克风,当你说话时会唤醒 iPhone,就像《星际迷航》里那样不用按任何按钮直接说话,并从企业号,呃我是说 iPhone 的人工智能,得到回应。 

  那么让我们来总结一下 Siri 对于人类而言意味着什么。Siri 是人机交互新纪元的黎明,是大众进入真正的人工智能时代的开端。 

  当然,目前它尚未达到完美,苹果目前将其定位在“beta”阶段。并且,它也还不是你在科幻电影里看到的那种无限高能的人工智能。 

  但它的步伐远未停止。iPhone 4S 里的 Siri 只是一个开端。相信以后会有更加复杂的版本出现。 

  Google、微软和其他公司也终会拿出自己的人工智能产品的(并且我预言就是按照这个排序)。 

  所以,一旦你最终和 Siri 搭上话了,请善待它。Siri 具有非常非常重大的现实意义,和以往任何产品都不同。它能够代表计算机发展的一个新纪元。当然,它会让每个人都“说”起来的。 

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics