"你的点评是我读过最愚蠢的东西。要描述你的愚蠢又同时避免任何侮辱性语言,让我倍感压力。"
两周前点评了谷歌(Google)的Moto X手机后,这样的电子邮件已成为我每日生活的亮点。
这些写信给我的人似乎对我点评中的一句话尤其不满:"Android的语音命令功能还是无法与Siri相提并论。"
天呐,我真的是犯傻了。谁会傻到在一场宗教战争中站队呢?我要是写了"保守派人士比自由派人士长得好看",或是"在堕胎问题上支持生命的人车开得不如支持选择权的人好",都会比这下场要好些。
但是,手机语音识别技术孰优孰劣,这可不是一个无关紧要的问题。一旦触屏成为手机的未来发展趋势,语音识别就变得至关重要。没有物理按键或按钮,输入文字和运行软件控制则会对操作精度要求极高,步骤也很繁复。
所以,我干脆花了两周时间潜心研究语音识别功能,到哪里都带着一部iPhone和一部运行谷歌Android操作系统的手机。我会同时对着两部手机讲话。我想要了解它们之间的不同之处以及优缺点。
当人们说起语音识别的时候,他们其实指的是三类不同的功能,也常常会加以混淆。它们分别是口述功能,手机将语音转化为文字;命令功能,用户通过说话来操作电话;还有网络信息搜索功能。这三类功能的优劣有很大的分别。
举例说,这两个系统的口述功能都还相当差劲。Android手机和iPhone的语音功能Siri都会在听写时出很多错。当你听到人们狂批手机的听写问题,宣布"我放弃了",他们通常指的是口述功能。
这是可以原谅的,可是想想吧。你要求手机能够理解不同的口音,且发声时距离麦克风的距离各异,房间里的背景杂音也各不相同。这个功能真能管用的话,那就是奇迹了。
最新版本的Android操作系统不需要网络连接就能够进行基本的口述操作。在Android系统中,你一边说,文字就会一边出现在屏幕上。而只有当你停止发声时,Siri才会开始显示文字。
从另一方面来说,Siri能够理解格式化指令,如"大写"、"全部大写"和"不空格",还有各种标点符号:"冒号"、"破折号"、"星号"、"省略号"等等。而Android只理解基本的符号,如"句号"、"逗号"和"感叹号"。
第二类功能,手机控制指令,对更多人来说则要成功许多。你可以说:"打电话给妈妈"、"给埃米莉(Emily)发短信"、"7点30分叫醒我"、"放点比利·乔尔(Billy Joel)的歌"、"提醒我到家时喂猫"等等。
当然,能在不触碰手机的情况下进行操控,这对安全很重要。如果你必须在开车的时候与你的电话进行互动,与它对话肯定会比盯着它看要安全。
但也不要忘记了便利的因素。说"打开愤怒的小鸟(Angry Birds)"要远比翻看满是图标的主屏幕快得多。另外,"将我的闹钟设在早上8点",也要比使用时钟应用省上375次手指按键的时间。
在这方面,Siri具有优势。举例说,开车的时候,你听到短信的声音,你可以说"读出我的新信息",Siri就会高声地读出来。它甚至会询问你是否要口述回复,在此期间你都无须将视线从路上移开。Android则无法做到这一点。
这两个操作系统都可以调用手机自带的一些应用。它们能够识别像"约鲍勃·巴尼特(Bob Barnett)周四中午见面"(日历[calender]中的一个交互功能)、"记住要还钱给哈罗德(Harold)"(备忘录[notes])、"发一封电子邮件给丹尼·库珀(Danny Cooper)"(邮件[mail]),还有"史蒂夫·阿尔珀(Steve Alper)的家庭住址是什么?"(通讯录[contacts])这样的指令。
然而,Android系统在网络搜索功能上要远超iOS。这两种手机在某些方面都十分出色,如获取天气预报的更新("本周末底特律的天气会怎样?")、时间("比利时现在几点?")、股票价格、体育信息("下一场牛仔队[Cowboys]的比赛是什么时候?")、兑换("32欧元兑换成美元是多少?")、计算("离情人节[Valentine's Day]还有多少天"?),以及其他各种网络搜索指令("一块好时[Hershey]巧克力中含多少卡路里的热量?"、"下一次日食是什么时候?"、"怎么拼写schadenfreude[幸灾乐祸]一词?"、"找一张1985年款科尔维特[Corvette]车的照片"等等)。
但网络搜索是谷歌的看家本领,因此Android系统的反应速度总的来说要快得多。(想在iPhone上尝试这种"说什么找什么"的感觉,可以下载谷歌搜索[Google Search]的应用。)
Android特别令人惊艳的地方在于,它可以不进行查找就向某地拨打电话("呼叫34号街上的梅西百货[Macy's]"),以及指示方向("告诉我如何通过公共交通前往拉瓜迪亚机场[La Guardia Airport]"),因为它的地图应用好得不可思议。它在回答关联问题时也更智能。如果你的第一个问题是,"希拉里·克林顿(Hillary Clinton)是谁"?你可以接着问,"她的丈夫是谁?"
不幸的是,Android有一个阿喀琉斯之踵,实际上,更像是阿喀琉斯的整条腿。想要发布语音指令,你必须点击谷歌搜索栏上的麦克风图标。而且它只在主屏幕或谷歌即时(Google Now)的界面下显示(从底部向上划)。所以当你的手机处于锁定状态,或在使用另一个应用时,就无法发出任何语音指令。
在iPhone上,你只需按住主键或是耳机线上的遥控器,就能在手机睡眠或在使用其他任何应用时启动语音控制功能。
换句话说,想要使用Android手机的语音功能,你必须常常拿起手机,还得总是看着它,这让该功能失去了许多意义。例外的是:像Moto X这样的摩托罗拉新手机,可以设置为随时收听指令。
Siri在搜索餐厅和电影的表现上也更好。两部手机都能听懂"附近不错的印度餐厅"或"呼叫代尔福德路上的橄榄园餐厅(Olive Garden)"。但Siri还能够订座,这多亏了它与OpenTable.com服务的结合。例如,你可以说,"预订周六晚7点的一家平价意大利餐厅。"
同样,针对问题,Siri的应答界面会给出迷人的、经过整理的答案,"本周有什么电影上映?""给我找出《迷途知返》(The Way, Way Back)的影评。"或"今天的《蓝精灵2》(The Smurfs 2)的场次是什么?"而Android只是显示出谷歌搜索的结果。
这也关乎个性:Siri有,而Android没有。
这里我们指的是俏皮话、笑话、态度,以及直呼你的姓名。如果你问Siri,"你老爸是谁?"她回答:"就是你。我们可以开始谈正事了吗?"你说,"把我传送上去,Siri。"她会说,"请除去你的腰带、鞋子和上衣,掏空你的口袋。"你说,"说脏话挑逗我吧。"她回答,"腐殖质、堆肥、浮石、淤泥、砾石。"
现在,在苹果和谷歌的男粉丝大战中,幽默可谓小把戏。当你提到Siri的个性时,仇视苹果的人会气得把自己眼睛挖出来。"这不实用!只是廉价的把戏!要描述你的愚蠢又同时避免任何侮辱性语言,让我倍感压力!"
这也没什么。这就是为什么我们可以选择:一个哲学流派里的两个阵营。(当然,还有Windows Phone和黑莓[BlackBerry],但它们的语音识别功能十分有限。)
所以,放下武器吧,男粉丝们。一旦你花时间了解,两套系统都特别好用。(这个网站上有个非常出色的Android语音指令列表:j.mp/12kEFDo。Siri的也有一个:j.mp/16Yy4yy。)
尽管Siri具有优势,但差距已经大大缩小了,而且两套系统都在迅速改进。很快,我们会更少地借助手机进行交流,而是会更多地与手机交流。
E-mail: pogue@nytimes.com
翻译:曹莉、林蒙克
纽约时报中文网