那是 1983 年,Acorn Computers 处于世界之巅。不幸的是,麻烦就在眼前。
这家英国小公司因赢得英国广播公司的合同——为全国电视节目生产电脑——而闻名。而这个被称作BBC Micro 的产品销量猛增,并有望超过 120 万台。
BBC Micro 的杂志广告,标语是“未来事物的形状”
但是个人电脑的世界正在发生变化。父母购买廉价 8 位微型计算机以帮助孩子完成家庭作业的市场变得饱和了。来自大洋彼岸的新机器,如 IBM PC 和即将推出的 Apple Macintosh,承诺具有更强大的功能和更易用的功能。Acorn 需要一种竞争方式,但它没有太多资金用于研发。
一个想法的萌芽
BBC Micro 的设计者之一索菲·威尔逊 (Sophie Wilson) 早就预见到了这个问题。她添加了一个称为“Tube”的插槽,可以连接到更强大的中央处理器。一个带插槽(slotted )的 CPU 可以接管计算机,让其原来的 6502 芯片空闲用于其他任务。
但是她应该选择什么处理器呢?Wilson 和联合设计师 Steve Furber 考虑了各种 16 位选项,例如 Intel 的 80286、National Semiconductor 的 32016 和 Motorola 的 68000。但没有一个是完全令人满意的。
286、32016 和 68000 CPU,大致按比例缩放
在后来接受计算历史博物馆采访时,Wilson 解释说:“我们可以看到所有这些处理器做了什么,没有做什么。所以他们没有做的*件事就是没有好好利用存储系统。他们没有做的第二件事是他们不快;它们不容易使用。我们习惯于用机器代码对 6502 进行编程,我们更希望我们能够达到一个强大的水平,这样如果你用更高级的语言编写,你就可以获得相同类型的结果。”
但是有什么选择呢?这家小型的公司Acorn 是否可以从头开始制造自己的 CPU?为了找出答案,Wilson 和 Furber 参观了 National Semiconductor 在以色列的工厂。他们看到了数百名工程师和大量昂贵的设备。这证实了他们的怀疑,即这样的任务可能超出了他们的能力范围。
然后他们参观了位于亚利桑那州梅萨的西部设计中心。该公司正在制造广受喜爱的 6502 并设计 16 位后继产品 65C618。Wilson 和 Furber 发现的只不过是一座“郊区的平房,里面有一些工程师和一些学生使用旧的 Apple II 电脑和一些胶带制作图表。
2022 年的西部设计中心
突然之间,制造自己的 CPU 似乎成为可能。Wilson 和 Furber 的小团队之前曾构建过定制芯片,例如 BBC Micro 的图形和输入/输出芯片。但这些设计比 CPU 更简单,组件更少。
尽管面临挑战,Acorn 的高层管理人员仍然支持他们的努力。事实上,他们不仅仅是支持。Acorn 联合创始人 Hermann Hauser拥有物理学博士学位,他为团队提供了IBM 研究论文的副本,描述了一种新的、更强大的 CPU 类型。它被称为 RISC,代表“精简指令集计算”。
参与到RISC中去
RISC到底是什么意思?为了回答这个问题,让我们参加一个关于 CPU 工作原理的超级简化速成课程。它从晶体管开始,这是一种由硅和不同化学物质混合而成的微型三明治状设备。晶体管具有三个连接器。当电压输入到栅极输入时,它允许电流从源极输入自由地流向漏极输出。当栅极上没有电压时,电流就会停止流动。因此,晶体管用作可控开关。
简化的晶体管
您可以组合晶体管以形成逻辑门。例如,两个开关串联构成“与”门,两个并联构成“或”门。这些门让计算机通过比较数字做出选择。
简化的AND 和 OR 门
但是如何表示数字呢?计算机通过将小的正电压等同于数字 1 而将无电压等同于 0 来使用二进制或基数 2。这些 1 和 0 称为位。由于二进制运算非常简单,因此很容易制作可以将 0 或 1 加到 0 或 1 上并存储和和可选进位的二进制加法器。大于 1 的数字可以通过添加更多同时工作的加法器来表示。同时可访问的二进制数字的数量是衡量芯片“位数”的一种方法。像 6502 这样的 8 位 CPU 以 8 位块的形式处理数字。
由与门和或门组成的全加器电路
算术和逻辑是 CPU 功能的重要组成部分。但是人类需要一种方法来告诉它该做什么。所以每个 CPU 都有一个指令集,它是它可以将数据移入和移出内存、进行数学计算、比较数字以及跳转到程序的不同部分的所有方式的列表。
RISC 的想法是大幅减少指令数量,从而简化 CPU 的内部设计。剧烈到什么程度?16 位芯片 Intel 80286 总共有 357 条独特的指令。Sophie Wilson 创建的新 RISC 指令集只有 45 个。
Intel 80286 和 ARM V1 指令集
为了实现这种简化,Wilson 使用了“load and store”架构。传统的(复杂的)CPU 有不同的指令来从两个内部“寄存器”(芯片本身的小内存块)添加数字,或者从外部存储器中的两个地址添加数字,或者将每个地址的组合。相比之下,RISC 芯片指令只能在寄存器上运行。然后,单独的指令会将答案从寄存器移至外部存储器。
比较通用 CISC CPU 和通用 RISC 的汇编语言,RISC 处理器必须在对它们进行操作之前将内存值加载到寄存器中
这意味着 RISC CPU 的程序通常需要更多的指令才能产生相同的结果。那么他们怎么可能更快呢?一个答案是更简单的设计可以以更高的时钟速度运行。但另一个原因是芯片执行更复杂的指令需要更长的时间。通过保持简单,您可以使每条指令在一个时钟周期内执行。这使得使用称为流水线的东西变得更容易。
通常,CPU 必须分阶段处理指令。它需要从内存中取出一条指令,解码指令,然后执行指令。Acorn 设计的 RISC CPU 具有三级流水线。当芯片的一部分执行当前指令时,另一部分正在获取下一条指令,依此类推。
ARM V1 流水线,每个阶段都需要相同的时间来完成
RISC 设计的一个缺点是,由于程序需要更多的指令,它们会占用更多的内存空间。早在 20 世纪 70 年代后期,当设计*代 CPU 时,1 兆字节的内存成本约为 5,000 美元。因此,任何减少程序内存大小的方法(并且拥有复杂的指令集都有助于做到这一点)都是有价值的。这就是为什么像 Intel 8080、8088 和 80286 这样的芯片有这么多指令的原因。
但内存价格正在迅速下降。到 1994 年,1 兆字节将低于 6 美元。因此,RISC CPU 所需的额外内存在未来将不再是问题。
为了进一步证明新 Acorn CPU的未来,该团队决定跳过 16位并直接采用 32 位设计。这实际上使芯片内部更简单,因为您不必经常分解大数,并且可以直接访问所有内存地址。(事实上,他们*个芯片只暴露了其 32 条地址线的 26 个引脚,因为 2 的 26 次方,即 64MB,在当时是一个荒谬的内存量。)
团队现在需要的只是为新 CPU 命名。考虑了各种选择,但最终,它被称为 Acorn RISC Machine,或 ARM。
*个ARM产品的诞生
ARM 的*款芯片的开发耗时 18 个月。为了省钱,该团队在将设计投入硅片之前花费了大量时间来测试设计。Furber 在 BBC Micro 上用解释型 BASIC 为 ARM CPU 编写了一个仿真器。当然,这非常慢,但它有助于证明这个概念并验证 Wilson 的指令集可以按设计工作。
根据 Wilson 的说法,开发过程雄心勃勃但简单明了。
“我们认为我们疯了,”她说。“我们认为我们做不到。但是我们一直发现没有真正的停靠点。这只是完成工作的问题。”
Furber 负责芯片本身的大部分布局和设计,而 Wilson 则专注于指令集。但事实上,这两项工作深深地交织在一起。为每条指令选择代码编号并不是随意的。选择每个数字,以便在将其转换为二进制数字时,指令总线上的适当电线会激活正确的解码和路由电路。
测试过程日趋成熟,Wilson 领导了一个团队编写了一个更高级的仿真器。“使用纯指令模拟器,我们可以在 6502 秒的处理器上以每秒数十万条 ARM 指令的速度运行,”她解释道。“我们可以编写大量软件,将 BBC BASIC 移植到 ARM 和其他所有东西,第二个处理器,操作系统。这给了我们越来越多的信心。其中一些东西比我们见过的任何其他东西都运行得更好,即使我们正在解释 ARM 机器代码。ARM 机器代码本身的性能如此之高,以至于在同一平台上,ARM 机器代码的解释结果往往优于编译代码。”
这些惊人的结果激励着小团队完成这项工作。*个 ARM CPU 的设计被送到美国半导体制造公司 VLSI Technology Inc. 进行制造。该芯片的*个版本于 1985 年 4 月 26 日返回 Acorn。Wilson 将其插入 BBC Micro 的 Tube 插槽,加载 BBC BASIC 的移植到 ARM 版本,并使用特殊的 PRINT 命令对其进行测试。芯片回答说,“Hello World, I am ARM ”,然后团队打开了一瓶香槟。
让我们退后一步,反思一下这是多么了不起的成就。整个 ARM 设计团队包括 Sophie Wilson、Steve Furber、另外几位芯片设计师,以及一个编写测试和验证软件的四人团队。这种基于高级 RISC 设计的新型 32 位 CPU 由不到 10 人创建,并且*次就可以正常工作。相比之下,National Semiconductor 直到 32016 的第 10 次修订仍然在发现错误。
Acorn 团队是如何做到这一点的?他们将 ARM 设计得尽可能简单。V1 芯片只有 27,000 个晶体管(80286 有 134,000 个!),并且采用 3 微米工艺制造——即 3,000 纳米,或者比当今 CPU 的粒度小大约一千倍。
ARM V1 芯片及其框图
在这种详细程度下,您几乎可以辨认出单个晶体管。例如,查看寄存器文件,并将其与这个关于随机存取存储器如何工作的交互式框图进行比较。您可以看到指令总线从输入引脚传输数据并将其路由到解码器和寄存器控件。
与*个 ARM CPU 一样令人印象深刻,重要的是要指出它缺少的东西。它没有板载缓存(onboard cache memory)。它没有乘法或除法电路。它还缺少浮点单元,因此对非整数的运算比预期的要慢。但是,使用简单的桶形移位器(barrel shifter)有助于处理浮点数。该芯片以非常适中的 6 MHz 运行。
那么这个小 ARM V1 表现又如何?在基准测试中,发现它在相同时钟速度下比 Intel 80286 快大约 10 倍,相当于以 17 MHz 运行的 32 位摩托罗拉 68020。
ARM 芯片还设计为以非常低的功率运行。Wilson 解释说,这完全是一种节省成本的措施——团队希望为芯片使用塑料外壳(plastic case)而不是陶瓷(ceramic)外壳,因此他们设定了 1 瓦功耗的*目标。
但是他们用于估算功率的工具很原始。为了确保他们不会超过限制并熔化塑料,他们对每个设计细节都非常保守。由于设计简单且时钟速率低,实际功耗最终为 0.1 瓦。
事实上,该团队将 ARM 插入的*批测试板之一的连接断开,并且根本没有连接任何电源。当他们发现故障时非常惊讶,因为 CPU 一直在工作。它只是由于支持芯片的漏电而开启的。
根据 Wilson 的说法,ARM 芯片令人难以置信的低功耗是一个“完全的意外”,但它后来变得很重要。
ARMing a new computer
按照常理,Acorn 拥有这项惊人的技术,*竞争对手数年。财务上的成功肯定很快就会到来,对吧?好吧,如果你关注计算机历史,你可能会猜到答案。
到 1985 年,BBC Micro 的销量已经非常惨淡,一方面受到廉价的 Sinclair Spectrum 的挤压,另一方面受到 IBM PC 克隆产品的挤压。Acorn 将其公司的控股权出售给了 Olivetti,此前它曾与 Olivetti 合作为 BBC Micro 制造打印机。一般来说,如果您要将计算机公司出售给打字机公司,那可不是什么好兆头。
Acorn 向研究人员和爱好者出售带有 ARM 芯片的开发板,但仅限于现有 BBC Micro 所有者的市场。公司需要一台全新的计算机来真正展示这种新 CPU 的强大功能。
在此之前,它需要对原始 ARM 进行一点升级。ARM V2 于 1986 年问世,增加了对协处理器(例如浮点协处理器,这是当时计算机的流行插件)和内置硬件乘法电路的支持。它采用 2 微米工艺制造,这意味着 Acorn 可以在不消耗更多功率的情况下将时钟速率提高到 8 MHz。
但仅靠 CPU 还不足以构建完整的计算机。因此,该团队构建了一个图形控制器芯片、一个输入/输出控制器和一个内存控制器。到 1987 年,包括 ARM V2 在内的所有四款芯片都已准备就绪,连同一台用于安装它们的原型计算机。为了反映其先进的思维能力,公司将其命名为 Acorn Archimedes。
考虑到那是 1987 年,人们现在期望个人计算机配备的不仅仅是输入 BASIC 指令的提示。用户需要像 Amiga、Atari ST 和 Macintosh 上那样漂亮的图形用户界面。
Acorn 在施乐 PARC的所在地加利福尼亚州帕洛阿尔托成立了一个远程软件开发团队,为阿基米德设计下一代操作系统。它被称为 ARX,它承诺抢占式多任务处理和多用户支持。ARX 很慢,但更大的问题是来晚了,太晚了。
Acorn Archimedes 正准备发货,但公司没有可在其上运行的操作系统。这是一个危机情况。所以 Acorn 的管理层去找 Paul Fellows 谈话,他是 Acornsoft 团队的负责人,曾为 BBC Micro 编写过多种语言。他们问他:你和你的团队能否在五个月内为阿基米德编写并发布一个操作系统?”
根据 Fellows的说法,他是那个说是的,认为团队可以做到的傻瓜。
对于从头开始制作操作系统来说,五个月的时间并不算多。Erzhege quick-and-dirty 的操作系统被称为“Project Arthur”,可能是以著名的英国计算机科学家亚瑟诺曼的名字命名的,但也可能是“ARm by THURsday!”的缩写。它最初是 BBC BASIC 的扩展。Richard Manby 用 BASIC 编写了一个名为“Arthur Desktop”的程序,只是为了演示您可以使用该团队开发的窗口管理器做什么。但是他们已经过时了,所以这个演示被烧进了*批电脑的只读存储器(ROM)中。
*批 Archimedes 模型于 1987 年 6 月发货,其中一些仍然带有 BBC 品牌标志。这些电脑速度*很快,而且物有所值——入门价为 800 英镑,在当时约为 1,300 美元。这与 1987 年售价 5,500 美元且具有相似计算能力的 Macintosh II 相比毫不逊色。
但 Macintosh 拥有 PageMaker、Microsoft Word 和 Excel,以及大量其他有用的软件。Archimedes 是一个新的计算机平台,在它发布时,可用的软件并不多。计算世界正在迅速向 IBM PC 兼容机和 Macintoshes(以及几年后的 Amigas)汇聚,其他所有人都发现自己被排挤了。Archimedes 计算机在英国媒体上获得了好评,并赢得了热情的粉丝群,但在头几年内售出的系统不到 100,000 台。
苹果的出现
Acorn 迅速采取行动修复 Arthur 中的错误,并致力于开发具有更多现代功能的替代操作系统 RISC OS。RISC OS 于 1989 年发布,紧接着发布了 ARM CPU 的新版本 V3。
V3 芯片采用 1.5 微米工艺制造,将其 ARM2 内核的尺寸缩小到可用芯片空间的大约四分之一。这为包含 4 KB 的快速一级缓存存储器留下了空间。时钟速度也增加到 25 MHz。
虽然这些改进令人印象深刻,但像 Sophie Wilson 这样的工程师认为 ARM 芯片可以进一步发展。但是,Acorn 迅速减少的资源所能做的事情是有限的。为了实现这些梦想,ARM 团队需要寻找外部投资者。
就在这时,另一家以一种受欢迎的水果命名的计算机公司的代表走进了门。
Apple 最初是如何听说 ARM 的?Apple 高级技术组的两名工程师 Paul Gavarini 和Tom Pittard构建了一台名为Möbius的原型计算机。它使用 ARM2 芯片并运行Apple 和 Macintosh 软件,模拟 6502 和 68000 CPU 的速度比本地版本快。Apple 的高层管理人员对这台机器感到困惑并迅速将其淘汰,但 Gavarini 和 Pittard 在内部演示中不断地鼓吹 ARM,在运行 LISP 时展示了令人印象深刻的基准。
LISP 是一种重量级语言,Apple 在内部使用它来测试新的图形界面。但它被认为对于嵌入式应用来说过于庞大。当 Apple 资深人士拉里·特斯勒 (Larry Tesler) 看到这些基准时,他灵机一动。
Tesler 刚刚接手了Apple Newton项目,他需要更换其缓慢且有故障的 CPU,即 AT&T Hobbit。ARM 芯片看起来像是赢家,因为它不仅是一个速度恶魔,而且其令人难以置信的低功耗使其成为手持牛顿设备的理想选择。
Tesler 安排了一次与 ARM 团队的会面,他喜欢他在他们的路线图中看到的内容。但有一个问题。Apple 是一家计算机公司,而 Acorn 是其直接竞争对手。
这为一个重大决定奠定了基础。ARM 员工希望摆脱 Acorn 日渐衰落的命运;Acorn 的大股东 Olivetti 对制造 IBM PC 克隆更感兴趣;制造 ARM 芯片的硅代工厂 VLSI Technology 想要更多的客户;Apple 想授权该芯片。
于是,剥离 ARM 符合每个人的利益。
1990 年 11 月,他们达成了三方协议。Apple 以 300 万美元现金购买了 30% 的股份。VLSI 投资了 50 万,加上它的知识和工具。Acorn 转让了其所有 ARM 知识产权和 12 名员工,价值 300 万美元。应 Apple 的要求,新公司更名为 Advanced RISC Machines。
从此以后,ARM 现在只能靠自己了。
一个新的*
在 Apple 放下资金之前,它想为 ARM 选择一位 CEO。Apple 聘请了发现 John Sculley 的同一家猎头公司,但这一次,它的结果要好得多。他们雇用的人是Robin Saxby。
Saxby 1947 年出生于英国切斯特菲尔德。小时候,他对电线很着迷,十几岁时,他开始了自己的*笔生意,修理收音机和电视机。他在利物浦上大学,学习电子工程。1968 年毕业后,他的*份工作是帮助设计英国*台基于晶体管的电视。
他于 1973 年加入摩托罗拉,并迅速晋升为销售工程师。这意味着他的工作是四处拜访公司的客户,帮助他们使用摩托罗拉产品进行设计。当他转到 CPU 部门时,他认为他的客户都是主流计算机公司。令他惊讶的是,大多数想要摩托罗拉 CPU 的人都想到了利基嵌入式应用程序。有一次,他为摩托罗拉写了一份提案,要求摩托罗拉分拆其 CPU 设计团队并提供设计服务,但管理层不喜欢这个想法。
在摩托罗拉之后,萨克斯比加入了一家名为 ES2 的初创公司,该公司试图开发一种新的硅芯片制造技术。ES2 已经为 ARM 构建了一些测试芯片,所以 Saxby 已经知道这家公司。但当他被要求加入 ARM 担任首任首席执行官时,他怀疑自己是否是这份工作的*人选。
为确保万无一失,他与 ARM 员工在一家酒吧安排了一次午餐会。当时,公司缺乏领导。Steve Furber 离开去寻找其他机会,而 Sophie Wilson 做出了“艰难的决定”——留在 Acorn,尽管她仍然可以提供咨询服务。剩下的 12 名 ARM 员工午餐迟到了,萨克斯比差点离开。但当他们到达那里时,会议取得了巨大的成功,所有 12 位工程师一致认为 Robin Saxby 是正确的选择。
即使那样,他也需要一点推动力。他问他 11 岁的女儿,他是否应该冒险接受这份新工作。她说:“爸爸,我有一个骰子,如果你掷骰子,结果是六,你就会成为百万富翁。”
他扔了,是一个六。于是Robin Saxby在1991 年初成为 ARM 的*任首席执行官。
开始新的尝试
公司需要的*件事是商业模式。Saxby 重新整理了他旧的摩托罗拉提案,并根据 ARM 的需要对其进行了修改。除了对售出的每块芯片收取一定比例的特许权使用费外,该公司将以预付费用的方式许可其技术。从理论上讲,这种组合足以让灯保持亮着。萨克斯比的愿景从一开始就雄心勃勃:他希望 ARM 成为“全球 RISC 标准”。
设定目标是一回事,实现目标又是另一回事。计算世界的其他部分也加入了 RISC 的行列。IBM 于 1986 年发布了6150 RT,随后是MIPS和 HP 的PA-RISC以及带有SPARC的SUN 。摩托罗拉在 1988 年推出了 88000,英特尔在 1989 年发布了 i860 和 i960,而 DEC 正在开发其 Alpha 芯片。与这些巨头中的一个竞争会很困难,击败所有人似乎更是不可能的任务。
但这些公司大多使用 RISC 来制造高端桌面工作站。Saxby 记得他在摩托罗拉的时候,嵌入式应用程序是一个被忽视的市场。也许全球 RISC 标准现在还遥不可及,但全球嵌入式 RISC 标准是可以实现的。与竞争产品相比,ARM 芯片的晶体管更少,消耗的电能也更少。这使得它们的制造成本更低,适用于更广泛的应用。
一些首批许可是针对传真调制解调器和其他小型应用程序的。早期,资金紧张,Acorn 最初向创始工程师承诺他们将在次年加薪,但在 1991 年,ARM 的现金告罄。萨克斯比表示,如果公司获得一份重要的新合同,他将兑现这一承诺。他与英国国防承包商Plessey签署了一项协议,并为工程师提供了回溯的加薪。
Saxby的*个新产品是 ARM6 内核,它是 ARM3 的后继产品。它采用 0.8 微米工艺制造,运行频率为 20 MHz。遵循降低指令集复杂性的理念,它只有两条新指令。核心本身只有 35,000 个晶体管,比原来的 ARM 的 27,000 个多不了多少。相比之下,Intel 的 386 有 275,000 个晶体管对于 Newton,ARM 将这个内核与内存管理单元和 4 KB 的一级缓存打包在一起。这就是 ARM610。
同时,公司推出了ARM250。它有较旧的 ARM3 内核,但也包括阿基米德计算机中的所有支持芯片:内存控制器、I/O 芯片和视频芯片。它是真正的“片上系统”或 SoC。当时,除了让阿基米德的制造成本降低一点外,它没有太大的市场。但它暗示了即将发生的事情。
ARM250 SoCL展望未来。
1993 年,Apple 终于发布了拖延已久的Newton。*年,它售出了 60,000 台。对于像苹果这样的大公司来说,这被认为是一次巨大的失败。但对于 ARM 来说,每个芯片的专利使用费为 20 美元,这是一笔意外之财。Saxby 将现金投资回 ARM,使公司规模从 30 人增加到 60 人,翻了一番。这是一场赌博。为了让它发挥作用,ARM 需要获得一些主要的许可。
吸引更多大客户
作为一家小公司,有时很难与大公司打交道。在与他的前雇主摩托罗拉会面时,Saxby回忆说这位高管在结束时说:“当然,我们无法向您支付任何许可费或版税。” 该公司预计 ARM 会乐于通过“曝光”获得报酬,因为摩托罗拉本可以自己完成这项工作。Saxby比问这位高管,他有多少工程师参与这个项目。答案是大约 200。“你知道吗,”Saxby比问道,“你支付给我们的许可费是你为你的工程师支付的费用的四分之一?” 他仍然拒绝给 ARM 钱,Saxby比放弃了这笔交易。
德州仪器 (Texas Instruments) 是另一家认为利用自己的内部资源可以比 ARM 做得更好的公司。当 TI 的 CPU 部门负责人向他的老板申请 ARM 许可时,他回击道:“你是说我们甚至无法在设计微处理器内核以嵌入基带芯片方面与其他公司竞争?” 后来,在讨论潜在合作伙伴关系的会议上,TI 人员在未签署保密协议的情况下抵达。Saxby坚持要他们立即离开,签完字再回来。ARM 可能很小,但 Saxby 不会让公司任人摆布。
TI 犹豫不决,但最终决定将 ARM 引入其*的客户之一:诺基亚。这是一个考验。如果 ARM 能够说服诺基亚使用其设计,它们就足以让 TI 构建它们。
1993年,诺基亚已是手机界的后起之秀,前一年手机销量已达300万部。它为其新型号制定了宏伟的计划,但该公司对 16 位 Hitachi H8 CPU(传统的 CISC 芯片)非常满意。32 位 RISC 芯片在速度和效率方面实现了巨大飞跃,但代价是同等代码需要更多的指令——而且每条指令占用两倍的内存。在台式机上,这种额外的内存需求没什么大不了的,但手机的内存和存储空间很小。
在与诺基亚会面后回家的航班上,ARM 工程师决定,如果 16 位是诺基亚想要的,那么 16 位就是诺基亚要得到的。他们创建了一套全新的简化 16 位指令集,并设计了将它们映射到现有 32 位指令集的电路。这样,您可以拥有占用更少内存的更小程序代码,但它的运行速度几乎是全 16 位芯片的两倍。开个玩笑,工程师称这些扩展为“Thumb”,因为拇指是Arm末端的东西,但这个名字卡住了。
当诺基亚工程师看到 Thumb 架构的计划,以及随之而来的更先进的 ARM7 内核时,他们非常兴奋。TI意识到这家英国小公司通过了考验,终于在1994年拿到了ARM授权。现在TI可以为新一代诺基亚手机制造先进的芯片。
这些手机中的*款是诺基亚 8110,它是*款采用 ARM 内核的GSM手机。几年后,它因出现在电影《黑客帝国》中而出名。
诺基亚 8110
步步高升
在被TI看上之后,ARM 再也没有回头。该公司现在在电子行业拥有真正的信誉。它与夏普、三星和 NEC 签署了协议。到 1995 年,公司拥有多达 10 个被许可人。
ARM7 很受欢迎。CPU 采用 0.35 微米工艺制造,运行速度高达 66 Mhz。Thumb 扩展对于移动应用程序或代码密度很重要的任何地方都很有用,但该芯片也可以全速运行 32 位代码。1996 年又有四家公司购买了 ARM 许可:Oki、Alcatel、Yamaha 和 Rohm。甚至摩托罗拉最终也接受了,并在次年签署了一项协议。
为什么那么多公司,包括已经制造了自己的芯片的大型电子公司,都想与 ARM 签约?部分原因在于成本优势——ARM 的许可并没有贵得让人望而却步,而且它们肯定比支付数百名工程师数年时间从头设计新芯片要便宜。另一部分是 Sophie Wilson 和 Steve Furber 创造的技术遗产:ARM 芯片制造速度快且易于制造,而且耗电量大。
但 ARM 还有另一张王牌:它不仅仅是另一家芯片制造公司。当 ARM 与其他公司合作时,它成为合作伙伴,帮助设计可以根据其他公司的特定需求定制的解决方案。诺基亚 Thumb 扩展的发明只是其中一个例子。ARM 还与 Digital Equipment Corporation 合作创建了StrongARM,这是一种更快的芯片版本,运行速度高达 233 MHz。这些功能强大的芯片最终出现在 Apple MessagePad 2000(改进版 Newton)、Eidos Optima 视频编辑工作站和 Acorn Computers 最新的 RISC PC(Archimedes 系列的新名称)中。
对于 Robin Saxby 而言,与竞争对手的芯片公司合作的想法始终是战略的一部分。“把你的敌人变成朋友,”他会说。“如果他们可以通过与你合作为自己赚更多的钱,他们为什么要和你打架?”
这种感觉弥漫在整个公司。ARM 发言人在接受 Ars 采访时解释说:“ARM 商业模式是一种基于成功的商业模式,其基础是 ARM 在其合作伙伴成功时取得成功。” 经过缓慢的起步,该公司现在证明这不仅仅是一个崇高的理想。它正在实现。
ARM 在 1990 年代飞速发展
但 ARM 仍然必须具有战略意义。当 LSI 半导体向公司申请许可证时,Saxby 拒绝了,尽管 CEO 给了他很多钱。他这样做是因为 LSI 将直接与 ARM 的制造合作伙伴 VLSI 竞争。相反,他要求 LSI 的首席执行官先给他们带来一些新业务,然后他再考虑。他带着硬盘公司 Western Digital 的合同回来了,每笔交易都有望扩大市场并帮助 ARM 成为标准。
到了上市时刻
到 1998 年,ARM 的规模已经超出了原来的谷仓。该公司拥有 274 名员工,上一年的收入为 4400 万美元,并且在出货近 1000 万个 ARM 处理器,同时实现了超过 800 万美元的利润。但ARM 还不是全球 RISC 标准——MIPS 在那里夺得桂冠,这主要归功于索尼 PlayStation——但它排在第三位,并超过了英特尔的 i960 和摩托罗拉的 PowerPC,它也是所有 RISC 芯片供应商中增长最快的。
所有这些积极的增长使公司上市成为了一个好时机。1998 年 4 月 17 日,公司在伦敦证券交易所和纳斯达克成功地进行了首次公开募股 (IPO)。该股票的初始价格为 5.75 英镑,或略低于 10 美元。那年晚些时候,当 ARM 报告销售了 5100 万个处理器时,股价飙升。ARM 最初只有 12 个人和一个梦想,现在是一家价值 10 亿美元的公司。
ARM 的两个创始投资者正朝着相反的方向前进。苹果公司在 1997 年亏损超过 10 亿美元,其运营现金正处于危险的低位。从 ARM IPO 的第二天开始,Apple 抛售了大部分股份,从 42.3% 的股份减少到不到 6%。这次套现帮助史蒂夫乔布斯在关键时刻稳定了公司。
Acorn也在苦苦挣扎。在销量持续下滑后,该公司放弃了 RISC PC 的开发,并取消了最终的“Phoebe”型号,只留下了其独特的黄色外壳。有一段时间,该公司的资本价值低于其持有的 ARM 股份的 24%。Acorn 卖掉了它的股票,用这笔钱对公司进行再融资和重组。1999年,公司更名为“Element 14”,并将重点转向开发电信产品。
在 ARM 成功的推动下,VLSI 技术继续发展。1999年6月被飞利浦电子以10亿美元收购。
一个不断变化的世界
ARM 最初只是一个疯狂的梦想。早在 1985 年,Sophie Wilson 和 Steve Furber 就查看了许多可用的 CPU,发现它们全都不够用。令人难以置信的是,他们带领一个 10 人团队从头开发了一个先进的 32 位 RISC CPU,只用了 18 个月就从想法到工作芯片。
最初的想法是利用这些惊人的 CPU 并围绕它们构建出色的个人计算机,从而接管世界。但是世界已经变了,没有更多的空间容纳新的、不兼容的计算机平台。相反,多亏了 Apple、VLSI 和 Robin Saxby 的远见,ARM 芯片发现自己可以自由地走到最需要它的地方。在接下来的十年里,从传真调制解调器到硬盘驱动器再到手机,各种小型设备最需要它。
但随着新千年的临近,这些小型设备变得越来越强大。尽管 Newton 失败了,但个人数字助理市场却在蓬勃发展,手机本身也开始具备类似 PDA 的功能。这个舞台是为 ARM 的*机遇和*挑战而准备的。
在这个时候,评估公司创始人史蒂夫·乔布斯 (Steve Jobs) 也得意洋洋地回到了他与他人共同创立的公司。1998 年彩色橡皮糖iMac的发布、与微软的协议以及苹果 ARM 股票的出售使该公司从濒临破产的境地转为稳固的财务基础。但苹果公司的“iCEO”仍在寻找下一件大事。
乔布斯为 iMac 配备了一种名为 FireWire 的新连接器,可以实现视频和声音的快速传输。一种称为 MP3 的文件格式越来越受到计算机用户在其计算机上共享音乐的欢迎,并且公司已经开始制造便携式 MP3 播放器。但这些设备的存储空间很小,USB 1.0 传输速度很慢,软件也很糟糕。乔布斯开始痴迷于打造一个播放器的想法,并将几乎所有的时间都投入到这个项目中。
Apple 与一家名为 PortalPlayer 的公司合作,该公司一直在开发自己的播放器。硬件使用了定制的 ARM 芯片 PP5502。它是一个片上系统,具有运行频率为 90 MHz 的双 ARM7 内核和 32MB 板载内存。主板上*的另一个大芯片是 FireWire 控制器。ARM 许可的灵活性使得设计具有用于 MP3 解码等功能的自定义电路的 CPU 变得容易。
原始 iPod 主板,ARM PP5502 SoC 在左下方,FireWire 控制器在右上角。
有多容易?一位熟人约翰·西姆斯 (John Sims) 博士向我讲述了大约同时期另一家 MP3 播放器公司的故事。一名工程师仅用了六个月的时间就将数字信号处理器 (DSP) 添加到标准 ARM 设计中。一家从头开始构建芯片而不是与 ARM 合作的竞争对手公司有 60 名工程师在类似的项目上花费了三倍的时间。
iPod 于 2001 年面世,在发布兼容 Windows 的版本后,这款小巧的音乐播放器成为了行业标准。在该设备的鼎盛时期,每年售出超过 5000 万台 iPod。虽然人们迷恋它的界面、易用性和标志性的白色耳机,但大多数人没有意识到 iPod 实际上是一台微型计算机。它有一个 CPU、内存、一个微型硬盘和一个操作系统,它的触摸轮和按钮就像一个小鼠标和键盘。它甚至有一个可以玩简单游戏的位图显示器。
说到游戏,ARM 在 2001 年的第二场大胜利是任天堂的 Game Boy Advance。作为最初的 Game Boy 的继任者,它配备了带嵌入式内存的 16.8 MHz ARM7 内核。它还有一个夏普 LR35902,用于与旧系统兼容。甚至便携式游戏机也在从 CISC 芯片跳转到 RISC 芯片。
每个人的掌上电脑
iPod 只是移动世界划时代变革时期的开始。在与摩托罗拉在 ROKR 翻盖手机中放入 iPod 进行了一次奇怪且最终注定失败的合作之后,Apple 将目光投向了从头开始制造新手机。
该项目始于 2004 年。乔布斯不确定是将 iPod 放大以将其变成电话还是剥离 Macintosh 的 OS X 操作系统以使其在移动设备上运行才是正确的方法。为了解决这个问题,乔布斯让竞争对手的团队同时研究这两种方法。Tony Fadell 的 iPod 团队经验丰富,但他们面对的是摩尔定律错误的一面。
摩尔定律显示了这些年来 CPU 的显着改进
ARM 芯片自 1985 年推出*个版本以来已经取得了长足的进步。该芯片具有 27,000 个晶体管,采用 3 微米工艺生产。这意味着晶体管和电线的直径大约为 0.000003 米,即 0.003 毫米。这可能看起来很小,但硅芯片制造的进步意味着到 2006 年,芯片代工厂正在使用 90 纳米工艺。这允许更多的晶体管,包括大量的快速缓存存储器,可以安装在相同大小的芯片上。这也意味着芯片可以以更高的时钟速度运行。
相比之下,软件的改进要慢得多。编写和测试以及修复每项新功能不可避免地引入的大量错误都需要时间。因此,等待摩尔定律推出可以运行现有 OS X 软件的移动芯片实际上比向 iPod 的准系统操作系统添加所有必要的功能要快得多。乔布斯决定采用精简的 OS X 方法。但仍然存在谁来制造芯片的问题。
乔布斯询问英特尔首席执行官保罗欧德宁是否愿意竞标为苹果即将推出的手机制造芯片的权利。这家制造巨头在为基于 Windows 的计算机提供动力的台式机 x86 CPU 的销售中名列前茅。但是,它还拥有基于 ARM 的业务 XScale,这是它于 1998 年从数字设备公司 (DEC) 购买的。因此,英特尔本可以轻松满足苹果的要求。
但欧德宁拒绝了这个提议。他计算出 Apple 愿意为每个 CPU 支付的最高金额低于 Intel 为制造这些 CPU 所花费的金额,而且他不确定 Apple 手机是否会大量销售。此外,他对显示对 XScale 的支持感到紧张,尤其是当英特尔正在开发即将推出的 x86 低功耗版本 Atom 时。他在 x86 上加倍下注,并于 2006 年出售了 XScale 部门。
这里有一定的讽刺意味。DEC 最初出售其 ARM 业务是因为它需要钱。它需要这笔钱,因为英特尔正在破坏 DEC 的小型机和工作站市场。随着时间的推移,更便宜的基于 x86 的 PC 的产量越来越大,这些大型计算机的竞争力越来越小。现在,英特尔放弃了同样的移动芯片部门,专注于台式机。
英特尔拒绝这笔交易后,苹果转向三星。这家韩国企业集团同意为苹果即将推出的手机制造功能强大的新型 ARM 芯片。它是 S5L8900,一个 ARM11 内核的 SoC(降频!)以 412 MHz 运行,128MB RAM,高达 16GB 的存储空间,以及一个集成的 PowerVR MBX Lite 3D 图形处理器。这是一款非凡的芯片,让人想起 1991 年的 ARM 250“芯片上的阿基米德”,但它的功能足以成为世纪之交的体面台式机的核心。
但它不是台式机。那是一部电话——而且是一部革命性的电话。乔布斯于 2007 年 1 月 9 日在 Macworld 上发布了 iPhone。今天重看发布会,感觉就像是历史的转折点。奇怪的是,乔布斯花了很多时间强调 iPhone 实际上是三种设备:电话、iPod 和互联网通信器。
现在没有人会这样描述 iPhone。这是一台装在口袋里的电脑。大型机有房间那么大,小型机有冰箱那么大,微型机有烤面包机那么大。这些新设备很容易被称为纳米计算机。相反,我们称它们为智能手机,尽管很多人已经很少使用电话部分了。
公告发布后,谷歌的 Android 子公司迅速改变了其产品计划,从生产黑莓克隆产品转向生产更接近 iPhone 的产品。2008 年发布的 T-Mobile G1 也在 ARM 上运行。它释放出大量的 Android 设备,所有设备都汇集在具有单个大触摸屏的黑色薄矩形的相同外形尺寸上。除了 iPhone 和 Android,所有其他智能手机平台都被淘汰出局,非智能手机很快就绝迹了。
安卓的快速迭代
芯片故事圆满结束
2008 年,Apple以 2.78 亿美元的价格收购了 PA Semi 。该公司雇用了 150 名工程师并设计了高能效的 PowerPC CPU。许多人想知道苹果为什么要收购一家 PowerPC 公司,尤其是在 2005 年苹果将 Macintosh 从 PowerPC 转移到英特尔 x86 处理器之后。
但 PA Semi 的工程师了解的不仅仅是 PowerPC。他们包括 DEC 的 Alpha 和 StrongARM 处理器的首席设计师,以及曾在 Intel 的 Itanium、AMD 的 Opteron 和 Sun 的 UltraSPARC 上工作过的人。苹果买的是一些世界*的处理器设计专家。
这个设计团队秘密工作了两年,直到 2010 年苹果推出 iPad。它没有使用三星的设计,而是运行在名为“A4”的东西上,这是苹果内部设计的*款 SoC(三星仍然制造该芯片)。它以 1 GHz 的速度运行,并使用更新的 ARM Cortex A8 架构作为起点。Cortex 设计从为*款 iPhone 提供动力的旧 ARM11 内核进行了重大升级。他们与最初的 ARM CPU 相差甚远!
插图显示工艺改进如何在每个维度上将原始 ARM1 缩小 100 倍
A4 芯片的发布并没有在 CPU 设计界引起任何轰动。它被视为对现有移动芯片的常规改进。例如,英特尔正忙于推广其高端 x86 台式机芯片,并试图通过其基于 x86 的低功耗 Atom 重新进入移动芯片市场。其他芯片设计公司,如高通,在他们自己的基于 ARM 的 SoC 设计方面取得了巨大成功,这些设计被用于许多不同的 Android 产品。
但是这些新的 Apple 芯片发生了一件有趣的事情。A4 在 2011 年被 A5 取代,其 CPU 能力翻了一番并显着提高了视频芯片速度。明年的A6做了同样的事情。然后,在 2013 年,A7 发布了。它是一个完全 64 位的 CPU,甚至击败了 ARM 本身,从 32 位过渡到 ARM。它有一个 64 位指令集,以及用作 iPhone 相机图像处理器的新定制芯片。
在智能手机中安装 64 位 CPU 似乎很可笑。手机真的需要超过 4 GB 的 RAM 吗?但随着时间的推移,这些争论开始变得越来越没有意义。随着 A7 让位给 A8 再到 A12,这些移动芯片的性能图表发生了一些有趣的事情。
Apple 的 ARM 芯片的性能开始赶上英特尔
正是2018 年 iPad Pro的发布,让人摸不着头脑。其 A12 仿生 CPU 的基准测试表明,在某些基准测试中,它比同类英特尔芯片更快(至少每个 CPU 内核)。这没有任何意义。移动芯片怎么可能比桌面芯片快?
答案是许多不同因素的结合。正如我们已经看到的那样,原始 ARM 设计的简单性和优雅性使这些芯片从一开始就在性能方面——尤其是每瓦性能方面——占据优势。这种优雅部分归功于精简指令集计算机 (RISC) 架构,它具有更简单的 CPU 指令,并且比英特尔的复杂 (CISC) x86 芯片更少。
但这些年来,英特尔并没有原地踏步。从 1995 年的 Pentium Pro 开始,该公司添加了一组隐藏的类 RISC微操作。每次程序员向 CPU 发送一条常规的 x86 指令时,它都会在内部翻译成这些微操作。这意味着英特尔芯片的运行速度几乎与最强大的 RISC 芯片一样快。x86 遗留包袱带来的任何速度损失都被英特尔巨大的规模经济所淹没——到 2010 年,这家 CPU 巨头每年销售近 3 亿个 CPU。它已经击败了其他 RISC CPU,如 SPARC、PowerPC 和 MIPS。甚至游戏机——不必太担心各代之间遗留代码的兼容性——到 2013 年也从 PowerPC 切换到 x86 芯片。
然而,全球智能手机市场的规模完全不同。世界上大部分地区仍然难以买得起 2,000 美元的个人电脑,但 200 美元的智能手机却更容易获得。结果,智能手机销量出现爆炸式增长,在 2010 年超过了 PC 销量,并且再也没有回头。到 2018 年,每年售出近 15 亿部智能手机。在英特尔放弃尝试在智能手机中使用 Atom 之后,每款手机中都装有 ARM 芯片。
随着时间的推移,电脑和智能手机的销量
现在,规模经济有利于三星和台积电 (TSMC) 等移动芯片制造公司。苹果向台积电投资数十亿美元,并将其所有芯片制造业务转移到那里。从制造的角度来看,英特尔无法跟上。2020 年,英特尔承认将不得不推迟从 10 纳米 (nm) 工艺向 7 纳米工艺的转变。与此同时,台积电跃升至 5 纳米制造工艺。虽然工艺数字在这种规模上开始失去意义,但有一点很清楚:智能手机芯片已准备好引领性能。
在 2020 年 11 月,他们做到了。就在那时,Apple发布了用于 Macintosh 计算机系列的 M1 芯片。这些芯片震惊了计算世界——它们比最快的英特尔 x86 CPU 更强大,但它们消耗的功率只是其一小部分。ARM 一直是每瓦性能的赢家,但这些芯片完全是另一回事。
35 年后,ARM 又回到了原点。
它始于 1985 年,作为台式电脑的芯片——尤其是 Acorn Archimedes。但当 Archimedes 未能占领市场时,ARM 芯片于 1990 年分拆成自己的公司。经过缓慢的起步,ARM 成为嵌入式 CPU 市场的标准,并进入流行的移动设备,如 iPod、 Game Boy Advance,以及 iPhone 和 Android 等智能手机。现在,终于,它又回到了个人电脑中。
但 ARM 的灵活性意味着这些计算机不一定是昂贵的,就像苹果公司销售的那样。2009 年,Raspberry Pi Foundation在最初的 ARM 芯片的发源地英国注册成立。它的使命是继续在教育中促进计算机科学,就像 Acorn 的 BBC 计算机在 1980 年代所做的那样。鉴于这个传奇的血统,基金会只会选择一个处理器。
*个 Raspberry Pi 于 2012 年发布。它是一个信用卡大小的单板计算机。Pi 配备了 ARM11 处理器、内置内存以及计算机所需的所有连接器:用于鼠标和键盘的 USB、耳机插孔、用于显示器的 HDMI 和以太网。它还带有一个“通用输入输出”或 GPIO 连接器,允许工程师轻松连接和控制灯、传感器和电机。它花了 35 美元。随后的模型变得更强大但并没有更昂贵。
ARM 最初的使命,即为大众提供计算能力,已经实现。
Raspberry Pi连接了一些闪烁的灯。
这一切意味着什么
2006 年,ARM 首席执行官 Robin Saxby 退休。他计划了一段时间。公司的状况非常好,而且他对 CEO 交接的管理也非常到位,消息传出时 ARM 的股价甚至连眼睛都没有眨一下。
尽管走了一条意想不到的道路,但公司创始人的成功超出了他们最疯狂的梦想。我有一个关于为什么会这样的理论。在我看来,这两家公司似乎都有出色的工程师和*的技术,但管理风格却截然不同。不过,为了检验我的想法,我必须找到一个在场并且了解 ARM 发生的一切事情的人。我需要和萨克斯比谈谈。
ARM 甚至将其竞争对手视为潜在的合作伙伴——当它帮助合作伙伴取得成功时,ARM 也从中受益。“因为德州仪器 (TI) 没有满足诺基亚需求的理想处理器,”他说,“所以他们有兴趣进行合作。” 这种合作导致 ARM 芯片成为手机市场的标准。
ARM 芯片销量随时间变化。