人类对于人造机械的想象和思考是源远流长的。
希腊神话中出现了赫淮斯托斯的黄金机器人和皮格马利翁的伽拉忒亚这样的机械人和人造人。根据列子辑注的《列子·汤问》记载,中国西周时期也已经出现了偃师造人的故事。
7月4 日,当2024世界人工智能大会在上海拉开帷幕,展前阵列出18款人形机器人时,带来的震撼是难以言喻的。本次现场展出了45款智能机器人,其中人形机器人有25款。
人形生物诞生
特斯拉二代人形机器人Optimus
现场,人影攒动。二代Optimus搭载的是与特斯拉车辆同源的AI 技术。二代Optimus在直立行走的基础上,行走速度提升了30%;其手指还“进化”到除了感知和触觉,可以在轻握鸡蛋和搬运重物时做到“游刃有余”。
特斯拉预计明年开始限量生产人形机器人,将有超过1000个Optimus在特斯拉工厂帮助人类完成生产任务。
开源通用人形机器人“青龙”
人形机器人(上海)有限公司当日发布了中国*全尺寸开源通用人形机器人,该款机器人身高185cm,体重80kg,拥有高度仿生的躯干构型和拟人化的运动控制,支持多模态机动、多模态感知、多模态交互和多模态操控,全身多达43个主动自由度,*关节峰值扭矩400N.m,算力支持400TOPs。负载40公斤时能以1m/s的速度行走。
乐聚“夸父”(KUAVO)机器人
“夸父”(KUAVO)是国内*搭载鸿蒙操作系统的全尺寸人形机器人,也是国内*实现产业化落地的全尺寸人形机器人,同样亮相展台。
夸父发布于2023年12月,重约45kg,全身26个自由度,行走速度最高可达4.6km/h,可快速连续跳跃,跳跃高度超20cm,搭载自研一体化关节和深度摄像头,可实现全方位视觉感知。
目前,夸父机器人已实现人形机器人小样本下的泛化操作,典型的成交案例包括与山东大学、北京通用人工智能研究院相关的科研合作。
天链人形机器人T1
身高约1.60米,全身自由度71个,人形机器人裸机仅重37公斤左右,含电池在43公斤左右,负重深蹲突破145kg。
工作人员介绍,这是目前行业内已知的最高水平,它可以做出一字马、跳跃、旋转、劈叉等动作,灵活性堪比舞蹈演员。值得一提的是,天链人形机器人T1全产业链自产自研。
宇树科技通用人形机器人H1
这是全球*原地后空翻功能的通用人形机器人。后空翻这种高难度动作的实现,不仅展示了机器人在平衡控制和动力系统方面的*性能,更预示着未来人形机器人可能在复杂地形和极端环境中发挥重要作用。目前,“宇树H1”机器人已经实现工业场景下的功能应用。
宇树科技CEO王兴兴表示:“具身智能是实现AGI的最有效途径,OpenAI的大方向大概率是错的。”他认为,未来5-10年肯定会有很大的技术突破,只有尽可能地相信AI,才会有更好的未来。
开普勒通用人形机器人K1
该机器人身高175cm,体重70kg,全身具备40个关节自由度、80多个传感器,还搭配了中国电信的星辰大模型,使之具备了复杂地形行走、智能规避障碍等多种功能。
“我们已经具备了商业化应用的潜力,计划在今年10月份进行小批量生产。” 开普勒CEO胡德波表示,目前来自物流、汽车制造、冶金等行业的意向订单非常多,“人形机器人商业化的节奏要比预期更快。”
人形机器人到底多少钱?
对于何时能够进入消费者市场,很多展商表示还有一段距离。在这段距离中,成本是一个问题。对于消费者来说,当前人形机器人的价格过于昂贵。
诸如特斯拉二代人形机器人Optimus价格在2万美元(14万人民币)、达闼机器人报价39.9万元起、天链机器人价格在50万~100万元左右、“夸父”(KUAVO)机器人价格在60万-80万元人民币、宇树H1单台售价约65万元。
除了明确表示未来目前是卖给个人的特斯拉,其他人形机器人的报价都在大几十万以上,并且如果需要装备完全的“大脑”、“小脑”、“灵活手”、“激光雷达”,价格上百万的可谓是轻轻松松。昂贵的价格对于消费者来说并不友好。
另一方面还是安全的问题。在现场交流的过程中,大多数厂商都表示对于“安全”还有一定顾虑。例如,在非密切接触的场景下,人们可以与机器人保持一定的距离,在保证自身安全的前提下观察其作业。但是,在养老或人员帮扶等需要肢体接触的场景中,人形机器人的安全性和风险问题不可小觑。
从人形机器人的应用来看,大多数应用还处于点对点的模式,当前的应用场景多为:科研研究、智能巡检、智能制造、仓储物流、户外作业等。
工业将是人形机器人*大规模应用的主流场景。
小米集团高级副总裁曾学忠预判,未来智能工厂将由三种劳动力构成:70%的自动化设备、20%的人形机器人、10%的人类。人类负责的是价值判定与挖掘,人形机器人则负责实现柔性制造、跨系统协同。三种劳动力协同作业,将重新定义“工人”与“工厂”。
因此,人形机器人的落地会先从进入一个场景(如工业)、实现多个功能开始,拓展到融入多个场景(物流、农业、消费等)、实现复杂功能,然后渐渐走进千家万户。
关于具身智能的讨论
每一家展商的标语中,都在宣称自己在做“具身智能”,是“AI的化身”,是未来的“新物种”。
在这里,想花费一些笔墨讨论一下“具身智能”的概念。
去年,北京市科委、中关村管委会等部门联合印发《北京市促进通用人工智能创新发展的若干措施(2023—2025年)(征求意见稿)》中提出,探索具身智能、通用智能体和类脑智能等通用人工智能新路径,推动具身智能系统研究及应用,突破机器人在开放环境、泛化场景、连续任务等复杂条件下的感知、认知、决策技术。
何为具身智能?MBA智库百科对其的定义,指的是通过创建软硬件结合的智能体,可以简单理解为各种不同形态的机器人,让它们在真实的物理环境下执行各种各样的任务,来完成人工智能的进化过程。
实际上具深智能与GPT-4的不同在于,GPT-4等是被动学习,即我们向机器提供什么样的数据(人类标签或产生的数据)机器就学习什么。而具身智能是一种全新的自主学习,能自我感知和理解物理世界,就像人类感知和理解外界环境能力一样。
总而言之,具身就是具有身体的智能体,英文是 Embodied AI,就是说给智能体赋予一个身体,这就是具身智能。
随着过去两年,大语言模型的进展,我们看到自然语言中通用智能是可以实现的。计算机视觉领域在 3D 理解和开放语义识别也获得了巨大进展,通用具身智能是业内都在期待的突破。
在世界人工智能大会上,宇树科技CEO王兴兴表示,对于具身智能而言,能够理解时间、空间以及物理规律的世界模型非常重要,“现在的大语言模型等很像活在梦里”,AGI需要有实物机器人的物理交互才能加深模仿和强化学习,同时也需要参与到人类的生活中,来体验和理解人类的情绪和性格。
从未来来看,具身智能将会是一个智能大脑配合多种不同构型的身体完成物理世界的不同任务。也正因此,业内一直在讨论一个很有意思的问题:具身智能必须是人形吗,必须是双足吗?靠机器狗,可不可以实现具身智能呢?
人形机器人投资热
2024年上半年,人形机器人赛道融资热度持续高涨。
根据不完全统计,2024年上半年全球人形机器人领域融资事件超过22起,融资金额超过70亿元。美国人形机器人初创公司Figure AI凭借6.75亿美元(折合人民币约49亿元)的巨额融资领跑全球,宇树科技则凭借近10亿元人民币融资登顶中国国内人形机器人融资榜榜首。
在A股市场,人形机器人概念股的表现同样亮眼。7月4日,人形机器人概念股在开盘后直线拉升。Wind数据显示,恒工精密开盘后不久收获20%涨停,雷赛智能、世运电路等随之涨停,斯菱股份、步科股份、北特科技、江苏雷利等跟涨。
不过,现场交流的多位业内人士都不约而同地表示:倘若机器人未来大规模应用,从制造业到服务业,真正走进公众生活,实现陪护老人、陪教儿童等,还有许多“软硬件”待升级。包括看得见的零部件灵敏度、安全性等,看不见的数据隐私、算法偏见、伦理道德等,都需要有更全面、更优化的解决方案,保障新技术、新产品的安全和可持续发展。
正如图灵1950年在《计算机器和智能》中写到:“目光所及之处,只是不远的前方,即使如此,依然可以看到那里有许多值得完成的工作在等待我们。”