打开APP

万字长文解读:亚马逊用 AI “重塑金身”的过程

一直以来,亚马逊好像跟高科技搭不上边,但最近几年 AWS、Alexa 等高科技产品却频频抢占头条;而在最近一季财报中,亚马逊表现亮眼,市值逼近 7000 亿美元。这背后是亚马逊对自己的重塑。

  最近,《连线》杂志就通过一篇长文讲述了亚马逊用 AI “重塑金身”的过程,雷锋网编译如下:

  2014 年年初,Srikanth Thirumalai 到办公室见了亚马逊 CEO Jeff Bezos。Thirumalai 是一位计算机科学家,他 2005 年离开 IBM 加入亚马逊,负责领导电商巨头的推荐团队。这次会面 Thirumalai 带来的可不是简单的部门发展问题,而是一项雄心勃勃的新计划,他要把最新的 AI 技术融合进自己领导的部门。

  他来的时候只带了“六张纸”。为了提高效率,Bezos 很早前就定了规矩,给他讲新产品和服务时必须控制在这样的长度之内。此外,这薄薄的六页纸内还得附上一个描述最终产品、服务或项目的新闻稿。

  现在,Bezos 正依靠自己手下的精兵强将把亚马逊打造成 AI 巨擘,而公司成立之初,其实它们就与 AI 结下了不解之缘(产品推荐、发货时间表和仓库机器人)。但最近几年,人工智能界又经历了一场革命,机器学习变得更加高效。特别是深度学习,成了计算视觉、语音和自然语言处理等技术快速发展的催化剂。

  21 世纪进入第 2 个十年后,其实亚马逊并没有及时通过 AI 借力,但它们已经意识到了这项技术的迫切性。显然,AI 将成为这个时代最关键的战场,包括谷歌、Facebook、苹果和微软在内的超级巨头都在这里布下了重兵,而亚马逊却没能及时跟上脚步。“我们向每个团队的负责人都问了同样的问题,‘你准备怎么利用这些技术并把它们整合进自己的业务?’亚马逊设备和服务业务副总裁 David Limp 回忆道。

  有心的 Thirumalai 把这件事记在了心上,在年度计划会上,他将自己有关机器学习的想法一股脑说给了 Bezos。当时他心里很清楚,整体重做现有系统风险实在太大,但他也深知,经过 20 年的调整,机器学习技术已经在图像和语音识别这两个与亚马逊业务不相关的领域取得了出色的成绩。

  “业内还没人真正将深度学习应用在产品推荐上且把亚马逊甩开。”他说道。“因此我们先要给自己以信心。”其实 Thirumalai 当时还没做好准备,但 Bezos 胃口很大。因此,Thirumalai 直接分享了自己更激进的方案,即借助深度学习重新定义推荐系统的工作方式。在这个过程中,可能会用到他的团队还没掌握的技术,不存在的工具,甚至没人想过的算法。Bezos 喜欢这场赌注,所以 Thirumalai 改写了新闻稿后就投入到紧张的工作中去了。

  有这个先见之明的可不止 Thirumalai 一人,其他部门的负责人也曾带着自己的六张纸来找过 Bezos,他们负责的是完全不同的产品,服务的客户也不是一群人。不过,他们的想法都与 Thirumalai 类似,即要用先进的机器学习技术改造亚马逊的部分业务。其中,还有一些主管提出要重塑现有业务,比如机器人和数据中心业务 AWS。还有一些高管提出要创建全新业务分支,如基于语音的家用电器,而这个想法最终进化成了 Echo。

  亚马逊内部的这次头脑风暴产生的影响远超单个项目的范畴。Thirumalai 就表示,之前他们部门在开会时,亚马逊的 AI 人才是不能列席的。“我们会进行交流,但不会互相分享太多进展情况,因为研发中的经验无法直接套用或转移。”他回忆道。他们成了广阔工程师海洋上的 AI 孤岛。不过,用机器学习改造公司的努力改变了一切。

  尽管亚马逊内部一直有“单线程”的文化,但 AI 的加入让各个团队开始打破界限,他们开始在项目上携起手来,与其他团队分享解决方案成了工作中的新常态。这样一来,亚马逊公司里的 AI 孤岛开始相互连接。随着亚马逊 AI 野心的增长,各项目面对的挑战也越来越复杂,这也为亚马逊带来了业内最*的人才,特别是那些想看到自己工作显出成效的人。对亚马逊这种一直以客户服务为导向的公司来说,这也成了搜罗纯研究型人才的好机会。

  在形容自家庞大业务的每一部分如何像永动机一样协同运作时,亚马逊经常会用到“飞轮”一词。现在,这台永动机上多了 AI 这个重要的飞轮,它能通过创新为其他团队提供动力,而别的团队则可借新技术开发新产品和服务,从而影响其他团队甚至整个公司,形成一个良性循环。除此之外,亚马逊还能用机器学习平台为其他公司提供付费服务,在大赚一笔的同时还能拿到更多数据进一步反哺整个平台。

  从一个深度学习领域的追随者变成令人生畏的巨头,亚马逊恐怕耗费了无数个“六张纸”。不过,这场转变的结果已经融入了整个公司,它的印记随处可见,其中就包括运行在全新机器学习架构上的推荐系统。在推荐你看什么文本、买什么产品和看什么电影时,亚马逊变得更智能了。今年,Thirumalai 又揽了个新活,他成了亚马逊搜索的主管,准备把深度学习融入这项服务的 DNA。

  “如果你七八年前问我,亚马逊在 AI 领域到底有多大影响,我肯定会说‘什么都算不上’。”华盛顿大学*计算机科学教授说道。“但随后它们便来势汹汹,而现在已经是一方霸主了。”

  Alexa 效应

  亚马逊在 AI 领域的拳头产品是智能音箱——Echo 和在背后驱动它的 Alexa 语音平台。这些项目同样也是“六张纸”的进化结晶,2011 年它以“运营计划 1”为名被放在了 Bezos 的办公桌上。该项目的参与者之一是名为 Al Lindsay 的亚马逊高管,他 2004 年就加入电商巨头,当时则被调离原有岗位去协助全新项目。“一款大脑完全存在云端的低成本计算机,靠语音完成交互。”这就是当时他构想中的新产品。

  不过,想打造这样的系统,也就意味着要将 Bezos *的《星际迷航》系列中那台话唠计算机变成现实。可是,它需要的人工智能技术却是亚马逊最缺乏的。更可怕的是,那些有能力完成这套系统的专家中,很少有人愿意为亚马逊工作。谷歌和 Facebook 搜罗走了大量 AI *人才。“我们现在是弱者。”Lindsay 说道,他现在已经贵为副总裁。

  “亚马逊给人的印象不好,学界认为它们对研究型人才不友好。”华盛顿大学教授 Domingos 说道。亚马逊一心只想着消费者和其零碎的文化氛围不符合学术界的调调,而且它们的待遇也比不过竞争对手。“在谷歌你就像还用着尿不湿的孩子,可以为所欲为。” Domingos 说道。“在亚马逊你可能得在小隔间里自己设置电脑。”更可怕的是,外界一直认为亚马逊是一家将创新工作守在公司机密下的公司。2014 年,机器学习大神 Yann LeCun 受邀在内部会议上向亚马逊的科学家做演讲。收到邀请时,其实 LeCun 已经拿到了 Facebook 的工作邀约,但他还是去了亚马逊。不过,在亚马逊的经历让 LeCun 很震惊。他先是在一个坐了 600 人的礼堂演讲,随后进了会议室,在这里等着一波接一波的问题小组。不过,当 LeCun 反问一些问题时,却没得到任何回应。这段经历让他决定转投 Facebook,跟亚马逊彻底说了拜拜。当然,Facebook同意开源 AI 团队的大部分工作也是一大吸引力。

  由于亚马逊没什么 AI 人才,所以它们只能凭着超厚的钱包开始买买买。“在 Alexa 的开发初期,我们买了很多公司。”Limp 说道。2011 年 9 月,它们吞下了 Yap,一家语音撰文子公司。2012 年 1 月,亚马逊又买下了 Evi,一家来自英国剑桥的 AI 公司,它们的软件能像 Siri 一样响应各种语音要求。2013 年 1 月,它们又收了 Ivona,这家波兰公司在文本转语音上有自己的一套,而该技术 Echo 开口说话的关键。

  不过,亚马逊的保密文化还是阻碍了它们从学术界吸引*人才的脚步。原本亚马逊想将业内的超级明星 Alex Smola 招致麾下。“他确实称得上是深度学习教父之一。”亚马逊 AWS 业务深度学习和 AI 主管 Matt Wood 介绍道。不过,亚马逊却不愿向他或其它候选人透露入职后到底要干什么。最终 Smola 拒绝了这个 offer,选择在卡耐基梅隆的一个实验室安顿下来。

  “即使是在 Echo 发布前,我们依然不受待见。”Lindsay 说道。“他们会说,‘我为什么要在亚马逊工作,我对卖货可没兴趣。”

  不过,亚马逊有自己的闪光点。由于它们会现在蓝图中放出产品功能,而有些功能挑战性十足,这就会吸引许多野心勃勃的科学家。Echo 的语音特性需要相当程度的会话 AI 技术支持,比如“唤醒词”、识别并转译命令、提供正确答案等,而这些技术当时都不存在。

  即使亚马逊没有公布最终产品是什么,这个项目也吸引了 Rohit Prasad(备受尊敬的语音识别科学家)的关注。在他看来,亚马逊缺乏 AI 专家是它们的一大特点,而不是 bug。“这里是一块带开垦的新天地。”他说道。“谷歌和微软搞语音项目已经很多年了。在亚马逊我们可能得从头做起并解决很多难题。”2013 年刚加入亚马逊,他就被派去做 Alexa 项目。“这款设备还只是个硬件,而且处在最早阶段。”他回忆道。

  Echo 音箱面临的最棘手问题是被称为远场语音识别的技术,为了它亚马逊不得不开辟新天地。这项技术不但包含转换并译出远处传来的语音命令,还要克服各种外界噪音和其它听觉干扰。另一大挑战则是设备不能花太多时间去理解语音命令,它需要将语音传到云端并迅速反馈答案,整个过程得像顺畅的聊天。想打造一套能在吵杂环境下理解并回应各种询问的机器学习系统需要天量的数据,而且这些数据从哪来也是个麻烦事。

  此前就有人研发过远场技术,但这项技术其实埋在了三叉戟核潜艇的鼻锥里,当时研发费用花了十亿美元。亚马逊可不造核潜艇,它们只是想把这项技术整合进一个厨房设备里,它必须足够便宜才行。“当时我的团队里有 90% 的人都不相信这事能办成。”Prasad 说道。“我们其实有个技术咨询委员会,但亚马逊没告诉它们我们在干什么。不过它们好像有些先知先觉,直接告诉我们,别碰远场识别。”

  Prasad 丰富的经验让他对这个项目充满信心。不过,亚马逊却没有一个能将机器学习应用于产品开发的系统。“我们有不少科学家在搞深度学习研究,但亚马逊没有基础设施将它们变成实际产品。”他说道。好消息是亚马逊体系内有所有零部件,比如一个*的云服务,装满 GPU 能轻松运行机器学习算法的数据中心和用不完的工程师。

  他的团队利用这些零部件搭建了一个平台,而这个平台本身就是一笔宝贵的财富,远超打造 Echo 任务的价值。“当我们搞定了 Echo 这款远场语音识别设备,就能获得做更大事的机会——我们可以将 Alexa 做成语音服务。”Spyros Matsoukas 说道,他是 Alexa 高级首席科学家。他们扩展 Alexa 的一种直接方式是允许第三方开发者打造自己的语音技术小程序,也就是后来我们所说的“技能”,这些“技能”可在 Echo 上运行。不过,这仅仅是个开始。

  从 Echo 身上抽出 Alexa 的魂魄后,亚马逊的 AI 文化开始逐渐凝聚起来。公司的各个团队开始意识到,Alexa 也可以为它们旗下的各种项目提供语音服务。“于是各种数据和技术开始凝聚在一起。”Prasad 说道。随后,*批亚马逊产品开始整合 Alexa。只要开口,你就能在 Alexa 设备上访问 Amazon 音乐、Prime 视频和你在主要购物网站上的个性化推荐等。接着,这项技术的覆盖面开始变的更广。“一旦我们拥有了基础语音能力,我们就能把它融入到非 Alexa 设备中,比如 Fire TV、语音购物及最终的 AWS。”Lindsay 说道。

  亚马逊内部漂浮的 AI 孤岛终于越来越近了。

  另一个促进亚马逊转型的关键环节是,一旦有数百万用户开始使用 Echo 或其他 Alexa 设备,就意味着它们正式在该领域扎根了。亚马逊能获得海量的数据,很有可能是史上*的语音驱动设备的交互集合。这些数据成了亚马逊招聘人才*的筹码。仿佛突然之间,原来对电商巨头嗤之以鼻的机器学习专家都想来这工作了。“Alexa 吸引力如此巨大,原因之一就是,只要你卖出一台设备,就获得了反馈资源。这其中不但包括用户反馈,还包括实打实的数据,它们对技术的提升,尤其是底层平台相当重要。”Ravi Jain 说道,他去年才加入亚马逊,现任该公司机器学习副总裁。

  因此,随着使用 Alexa 人数的不断增加,亚马逊获得的信息不但能提升系统表现,还能为自家的机器学习工具和平台充电,同时还让自己成为机器学习科学家趋之若鹜的大磁铁。

  这个重要的“飞轮”终于转起来了。

  更聪明的云

  2014 年起,亚马逊开始面向 Prime 会员销售 Echo。同年,Swami Sivasubramanian 开始爱上机器学习。当时的他负责 AWS 数据库和分析业务,回老家(印度)探亲的他由于没倒过来时差,深夜还在摆弄类似谷歌 Tensorflow 和 Caffé 等工具,这可是 Facebook 和学界都非常青睐的机器学习框架。熟悉了之后他发现,如果将这些工具与亚马逊的云服务相结合,能产生难以估量的巨大价值。他认为,通过降低云计算中机器学习算法的难度,亚马逊能深挖出更多潜在的需求。“我们每个月都为数百万开发者提供服务。”他说道。“他们中大多数人都不是麻省理工的教授,而是没有机器学习背景的普通开发者。”

  深思熟虑之后,他带着自己“史诗级”的六张纸去了 Bezos 的办公室。从某种程度上来说,那六张纸就是为 AWS 服务添加机器学习服务的蓝图。不过,Sivasubramanian 的眼光放的更远:他想让 AWS 成为整个行业机器学习活动的中心。

  从某种意义上来说,为成千上万的亚马逊云服务用户提供机器学习是大势所趋。“当我们*次整合出 AWS 的原始商业计划时,我们的任务是拿到那些只有少数财大气粗的组织才有的技术,并将其进行大范围推广。”AWS 机器学习高管 Wood 解释道。“在计算、存储、分析和数据库上,我们成功做到了。亚马逊在机器学习上也走了相同的道路。”更有利的是,AWS 团队可以借鉴公司内部其他团队积累的经验。

  2015 年,AWS 的亚马逊机器学习首次上线,它让类似 C-Span 的用户设置一个是人面部列表,Woods 说道。Zillow 用它来估算房价,Pinterest 则用它来做视觉搜索。此外,还有几家自动驾驶新创公司在用 AWS 机器学习搞道路模拟,以快速提升产品竞争力。

  一年以后,AWS 又推出了新的机器学习服务,这次它们更直接的借鉴了 AWS 的创新,加入了一种名为 Polly 的文本转语音组件和一种名为 Lex 的自然语言处理引擎。这些新功能让 AWS 的客户能打造自己的迷你版 Alexa。除此之外,亚马逊还有了视觉服务 Rekognition,它们要像谷歌、Facebook 和苹果那样在图像识别领域掌握自己的魔法。

  这些机器学习服务不但成了亚马逊的金矿,还是电商巨头 AI 飞轮的关键点,无论是 NASA 还是橄榄球大联盟,都成了亚马逊机器学习服务的大客户。随着企业纷纷在 AWS 内建立起重要的机器学习工具,它们未来另起炉灶与电商巨头竞争的可能性变得越来越小。

  就拿 Infor 这家公司来说,它们是企业应用领域的巨头,最近还发布了一款名为 Coleman 的应用,该应用让用户能自动处理各种流程、分析性能,并通过语音对话界面与数据进行交互。这可不是 Infor 从零开始打造的聊天机器人,而是使用 AWS 的 Lex 技术生成的。“反正亚马逊已经做好了,所以我们干嘛还要花时间重来一遍呢?我们了解自己的客户,这款应用*适合他们。”Infor 高级副总裁 Massimo Capoccia 解释道。

  AWS 在以太网上的统治力也让它拥有了对手没有的战略优势,尤其是谷歌,搜索巨头希望用自己在机器学习上的*来追赶 AWS 在云计算上的地位。诚然,谷歌能在服务器上给用户提供速度超快的机器学习优化芯片,但 AWS 在交互上更为简单方便,而且亚马逊的完整链条还方便公司们销售产品。“就像 Willie Sutton 说的,他之所以去抢银行,是因为那里存了很多钱。”DigitalGlobe CTO Walter Scott 在解释自家公司为何选择亚马逊当合作伙伴时打了个形象的比方。“我们选择 AWS 来搞机器学习,是因为我们的客户都在这。”

  在去年 11 月的 AWS re:Invent 大会上,亚马逊推出了一款更为全面的机器学习产品:SageMaker,它虽然看起来复杂,但其实是个相当易用的平台。它的创造者之一就是 Alex Smola,那位五年前拒绝了亚马逊的机器学习大神。当 Smola 决定重返机器学习行业时,他就立志要打造一款强大的工具,让普通的软件开发人员也用上这项技术,因此他选择回到亚马逊,这个能将机器学习威力产生*影响的地方。“现在的亚马逊*不能错过。”他解释道。“你能写出漂亮的论文,但如果不做出真正的产品,就不会有人用你漂亮的算法。”

  当 Smola 告诉 Sivasubramanian,打造一个惠及数百万人的机器学习工具比写一篇漂亮的论文更重要时,他得到了一个惊喜的回复。“你的论文一样可以发表啊!”Sivasubramanian 说道。是的,你没看错,亚马逊现在也有自由的环境了。“这不仅有助于吸引*人才,还让外界了解了亚马逊到底在研究什么。”Spyros Matsoukas 说道,他就是亚马逊这套开放方针的推动者和制定者。

  当然,现在就断定 SageMaker 将成为数百万用户的*还有些早,不过每个客户都会发现它们在亚马逊上投入了巨大的资金。同时,该平台也足够成熟,就连包括 Alexa 团队在内的亚马逊内部团队也准备转向 SageMaker,与外部公司使用相同的工具集。它们相信这能省下大量的工作时间,使自己能专注于解决更为复杂的算法任务。

  即使最终只有一部分 AWS 用户选择 SageMaker,亚马逊也能拿到大量有关系统表现的数据,促使它们对数据进行持续改进。这又形成了一个良性循环,更好地平台必然会带来更多用户。飞轮处在高速运转中。

  AI 无处不在

  随着机器学习的逐渐成熟,亚马逊的 AI 专家现在已经遍布了旗下各个团队,这让 Bezos 感到非常满意。虽然亚马逊没有设立 AI 中心,但它们已经有了一个专门负责机器学习普及和支持的部门。同时,它们还有一些专注于将新技术导入公司项目的应用研究。眼下,亚马逊的核心机器学习小组由 Ralf Herbrich 领导,这位高管此前曾在微软和 Facebook 两家巨头待过,2012 年才转投亚马逊。“公司内部建立个自己的社区非常重要。”他说道(这个项目同样也是六张纸演化而来的)。

  Ralf Herbrich 的部分职责包括培养亚马逊快速成长的机器学习文化。由于它们坚持以客户为中心的政策,因此解决问题比漫无目的的研究更重要。亚马逊的高管也承认,他们招聘时更偏向那些经世致用,真正有兴趣打造新事物的人,而不是那些追求科学突破的人。Facebook 的 LeCun 则从一个角度表示:“即使不领导这些知识先锋,你也能做的很好。”

  不过,在培养员工适应人工智能上,亚马逊正在学习 Facebook 和谷歌的经验。它们会开设许多有关 AI 的内部课程,而且从 2013 年起,每年春天亚马逊都会在总部举办一次内部的机器学习学术会议。“刚开始只有几百人参会,现在已经有几千人了。”Herbrich 说道。“西雅图总部*的会议室也容不下那么多人同时开会,所以我们只能通过视频直播向园区内其他六个会议室传达会议情况了。”一位亚马逊高管表示,如果人数继续增加,恐怕这个会就不能叫做亚马逊机器学习大会了,直接叫亚马逊就行。

  Herbrich 的团队还在继续推动机器学习融入公司的每一个细胞。举例来说,产品交付团队想要更好地预测客户订单到底要用哪种尺寸的盒子包装(一共 8 种尺寸),所以它们就找了 Herbrich 寻求帮助。“产品交付团队不需要另设专门的科学家小组,但它们需要这些算法,而且用起来得简单。”Herbrich 说道。在另一个例子中,David Limp 讲述了亚马逊是如何预测用户购买新产品可能性的。“我在消费电子领域摸爬滚打 30 年了,其中有 25% 的工作都需要人类判断、电子表格和各种魔术贴来完成。”他说道。“但加入机器学习后,我们的失误率开始显著下降。”

  即使如此,有时候 Herbrich 也得用上最尖端的技术。就拿亚马逊生鲜服务来说,虽然该服务运营时间已经有十年之久,但怎样更好地评估蔬菜和水果的质量依然是个麻烦事。毕竟人类评判速度太慢,而且容易前后不一致。于是,他在柏林的团队搞了搭载传感器的硬件和新算法,弥补了现有系统不能触摸和嗅探食物味道的能力。“三年之后,我们就能拿出原形产品,到时判断生鲜食品的质量就更简单也更可靠了。”Herbrich 说道。

  不用说,这样的技术进步肯定能逐渐渗入亚马逊的整个生态中。以最新的 Amazon Go 无人超市为例,其负责人就表示自己从 AWS 项目中学到了不少。“不过,AWS 也是受益者。”Amazon Go 技术副总裁 Dilip Kumar 说道。Amazon Go 有自己独特的流媒体数据系统,它会通过数百个摄像头采集购物用户的一举一动,它们团队的创新为 AWS 旗下的 Kinesis 提供了帮助,该服务让用户能将多个设备上的流媒体视频上传到亚马逊的云端,对这些数据进行处理分析就能不断改进自家的机器学习技术。

  即使是还没用上自家机器学习平台的亚马逊服务,也能为这个过程贡献一份力。眼下,亚马逊的 Prime Air 无人机递送服务还处在原型阶段,由于不能靠云端连接,无人机必须搭建自己的 AI 系统。不过,它还是从 AI 飞轮上借了不少力,既能从公司其他部门汲取营养,又能摸清到底该用什么工具。“在我们看来这就是个菜单,每个人都在分享自己的拿手菜。”Prime Air 副总裁 Gur Kimchi 说道。同时,他也相信,自己的团队最终也会有拿手菜贡献给这份菜单。“我们正在通过问题总结的经验未来肯定会引起其他亚马逊团队的兴趣。”

  事实上,这个预言已经开始应验了。“如果有人在公司看到一张图片,比如 Prime Air 或 Amazon Go,他们可能就会学到些什么并打造一个新算法,然后通过公司内的讨论和交流再结出新的果实。”亚马逊机器人部门首席科学家 Beth Marcus 说道。“然后我团队中的人就可以用它来解决自己的问题。”

  那么,一个以产品为中心的公司能打败那些拥有大量深度学习大咖的公司吗?亚马逊就正在为这个问题验证答案。“尽管它们还处在追赶状态中,但发布的产品可足够令人惊讶。”Oren Etzioni 说道,他是艾伦人工智能研究所 CEO。“它们是家世界级的公司,正在打造世界级的 AI 产品。”

  飞轮还在快速旋转,还有许多我们不知道的“六张纸”正在积聚力量呢。它们可能会为亚马逊带来更多数据,更多用户,更好的平台和更多人才。

  “Alexa,亚马逊在 AI 领域表现如何?”

  答案恐怕很简单,肯定是 Bezos 标志性的大笑呗。

【本文由投资界合作伙伴微信公众号:雷锋网授权发布,本平台仅提供信息存储服务。】如有任何疑问题,请联系(editor@zero2ipo.com.cn)投资界处理。

相关资讯

电子商务数据总览

最新资讯

热门TOP5热门机构 | VC情报局

去投资界看更多精彩内容
【声明:本页面数据来源于公开收集,未经核实,仅供展示和参考。本页面展示的数据信息不代表投资界观点,本页面数据不构成任何对于投资的建议。特别提示:投资有风险,决策请谨慎。】