今年 4 月底,北京具身智能机器人创新中心发布全尺寸人形机器人「天工」,实现了全球*纯电驱拟人奔跑,甚至是直接一路小跑到发布现场。
4 个月后,所有人形机器人都开始「跑步」进场了。
8 月 21 日到 8 月 25 日,在为期五天的 2024 世界机器人大会(World Robot Conference,简称 WRC)上,有 27 款人形机器人集体亮相,创下历届之最。毫无疑问,人形机器人就是本届世界机器人大会的主角,也吸引了外界绝大部分的目光。
北京具身智能创新中心最新升级的「天工 1.2 MAX」,在各个展台间穿梭、行走;
特斯拉人形机器人「擎天柱(Optimus)」,继续在玻璃展柜中展示它的「高冷」;
还有一位「悟空」身披红色斗篷在人流中走来走去,实际上这是宇树科技推出的 G1 量产版人形机器人;
优必选的 Walker S 系列人形机器人,则在展台上给奥迪 RS5 的轮胎现场做质量检查;
乐聚的「夸父」人形机器人则基于 OpenHarmony 搭载华为盘古具身智能大模型,在现场展示了叠衣服、洗碗、做华夫饼等家务活动;
……
悟空皮肤的 G1 人形机器人,图/微博
也难怪,有中科院自动化研究所的工作人员向媒体感慨,「去年都是(机器)狗,今年都是(机器)人。」
具身智能的进步,商业化的落地尝试,都让我们在这届世界机器人大会看到了人形机器人进化速度,以及「商用元年」的迹象。但人形机器人,终于走到爆发前夜了吗?
具身智能「踏进」社会,
从进厂「打工」开始
「人工智能拥有了身体,人形机器人拥有了大脑。人形机器人是具身智能的*实践。」目前普遍认为,人形机器人就是具身智能*的载体,或者更具体地说:具身智能的通用机器人,一定是人形的。
持类似观点的人不乏*技术专家、科技巨头掌舵人,包括李飞飞、马克思、黄仁勋等。而除了从人类进化史的角度、从机器人技术的角度来论证这一观点,还有一种角度认为,人形机器人是具身智能「*载体」的核心原因是:
现代人类社会,是为人类设计的。
简而言之,从建筑到工具,从规则到任务,我们身处的社会都是从人类的角度进行设计,绝大部分也直接面向人类自己。所以,与人类相似大小、结构的人形机器人能够无缝嵌入到人类社会中,进行送货、建造以及各种服务。
在国内*的机器人展会——世界机器人大会上,也能看到这一点。
本届大会期间,人形机器人公司优必选首次公开展示了「人形机器人工业场景解决方案」,即在现场展示人形机器人在模拟车间质检、分拣、搬运等方面能力。其中一个环节里,就是优必选 Walker S 人形机器人对奥迪 RS5 的前后轮胎进行了质量检查。
据介绍,Walker S 通过全身搭载的摄像头实现毫米级的螺栓检测,深度学习模型的应用使得螺栓检测准确率超过 99%,检查结果可以实时反馈至本地管理系统并进行可视化显示,保证产品的高质量交付。
人形机器人要进汽车工厂,不是*遭。
2022 年,特斯拉人形机器人「擎天柱」首次亮相时,马斯克就明确指出,「擎天柱」未来将到特斯拉工厂「打工」。今年 5 月,特斯拉放出视频表明,「擎天柱」二代已经开始进厂执行分拣电池——将电动车电池单元精准分装到卡槽中。
特斯拉甚至不是最早的。
今年 2 月,蔚来汽车就在旗下工厂的装配线上测试了优必选的人形机器人 Walker S,主要用于车辆门锁、安全带、前灯罩等方面的质量检查。OpenAI、英伟达、微软联合投资的人形机器人初创公司 Figure AI,旗下搭载 GPT-4o 的 Figure 01 人形机器人,之后也被宝马引入了制造工厂。另一家人形机器人初创公司 Apptronik 则与奔驰合作,计划将旗下人形机器人 Apollo 引入奔驰工厂之中。
搭载 GPT-4o 的 Figure 01,图/ Figure AI
此外,越来越多人形机器人开始走向量产。宇树科技在这次大会期间就展出了量产版 G1 人形机器人,定价 9.9 万元起,而且面向个人用户出货。同样参加本届大会的智元机器人(Agibot),则在 8 月的发布会就已宣布,旗下双足人形机器人将于今年 1 月开始量产。
从这些变化来看,作为具身智能的*载体,人形机器人正在集体走向量产、商用的阶段,而这背后的关键之一是技术进步带来的推动力。
「大脑」与「身体」共同发育:
具身智能不止大模型
1950 年,被后世誉为「计算机科学和人工智能之父」的图灵首次提出了「具身智能(Embodied Intelligence)」的概念。而与之相对的另一个概念「体外智能(Disembodied Intelligence)」,这在 1956 年的达特茅斯会议上被香农等人定义为:人工智能(Artificial Intelligence)。
而大模型的技术进步不仅让我们见证了人工智能「一日千里」般的进步,也让黄仁勋乃至更多人认为,人工智能的下一个浪潮将是具身智能。
事实是否如此,我们暂时还不知道。但可以肯定的是,过去一年多大模型在加速机器人「大脑」的发育,让人形机器人更加理解世界、更能思考出正确的答案和行动,也让人形机器人「感知-决策-执行」的链条得以完整跑通。
与此同时,大模型的技术进步也让机器人公司分化出了「大脑」和「身体」两种发展路线。比如在本届世界机器人大会上,科大讯飞就明确表示,目标是依靠大模型技术优势,来打造机器人的「大脑」,「推动机器人行业『脑力』升级。」
图/科大讯飞
与之相对的宇树科技,更加强调「身体」而非「大脑」。
我们需要知道,与通常概念的人工智能不同,具身智能要求机器人理解物理世界的运作规则以及各个物理量之间的耦合关系,并且要能通过机器人的「身体」与物理世界直接交互。
宇树科技本次展出的量产版 G1 人形机器人,不仅同样可以加速奔跑,还可以单脚跳、旋转跳、上下楼梯,同时还表现出了相当不俗的抗推倒、防绊倒等能力。
量产版 G1,图/宇树科技
而更接近成人体型的 H1 人形机器人(身高 180cm)也在大会现场,这是全球*支持原地后空翻的电驱人形机器人,同时还刷新了全尺寸人形机器人移动速度的世界纪录,可达 3.3m/s(接近 12km/h)。
GTC 大会上就亮相过,图/英伟达
可以说,具身智能今时今日的发展,绝不只是大模型带来「大脑」上的升级,同时也离不开在「身体」上的迭代与进步。
但到了这届世界机器人大会,我们是否能说人形机器人距离「iPhone 时刻」已经不远了?
人形机器人的“iPhone时刻”,
还有多久?
宇树科技创始人兼 CEO 王兴兴,在大会期间接受采访时表示,人形机器人行业与「iPhone 时刻」还有一定的距离,预计需要三四年左右,最多不会超过五年。不过即便如此,他也坦言,宇树科技不会「All in 人形机器人」,而是四足机器人和人形机器人:
「两条腿」走。
诚然,人形机器人是这届大会的*主角,也是外界现阶段最关注的机器人类型,但人形机器人距离成功还存在很多挑战。
猎豹移动董事长兼 CEO、猎户星空董事长傅盛就指出,人形机器人还存在易摔倒、成本和能耗「三大问题」,距离真正产业化应用还很远。而事实上,世界机器人大会也确实不只是人形机器人,还包括宠物机器人、手臂机器人以及更多适用于不同场景的专用机器人等,同样吸引了不少的目光。
宠物机器人,孩子们的「心头好」,图/微博
而即便人形机器人能在三四年后迎来「iPhone 时刻」,这些更专用而非通用的机器人也仍然存在不小的市场空间。毕竟,就像我们如今不只需要人的陪伴和服务,也需要宠物和各种机器,人形机器人或许重要,但也不会替代一切。