探寻人形机器人:是必然方向还是漫长征途?

4次阅读

共计 1528 个字符,预计需要花费 4 分钟才能阅读完成。

2025 年,被称作“具身智能元年”,连政府工作报告中都出现了“具身智能”和“智能机器人”。众多机器人开始在社交平台刷屏,像宇树机器人那套拳法耍得有模有样,众擎机器人在深圳湾与跑者同框竞跑。越来越多机器人进入大众视野,推动了相关企业市值与融资。然而,有个问题一直萦绕:为何所有机器人都是人形的呢?

具身智能的最终方向

大众对“机器人幻想”多源于好莱坞,斯皮尔伯格、詹姆斯·卡梅隆等导演眼中,机器人不是冰冷金属躯壳,而是有血有肉的生灵,它们不知疲倦、不断进步、感情更专注,还思考着哲学问题。于是,T-800 终结者、银翼杀手等都是类人形态。在电影影响下,大家觉得机器人首先要像人,起码会两条腿走路。在具身智能赛道里,人形机器人是最耀眼的存在。因为在物理世界,人类活动复杂多元,设施和工具多以人类使用为基础建造。人类期望机器人代替劳动,只有人形机器人能最大程度适应物理世界,无需改造世界来适应它。滚轮和履带速度虽快,但遇台阶咋办?四足虽站得稳,却缺“手”无法胜任人类工作。所以,把机器人设计成人形,拥有人的运动能力,才能更好适应环境、驾驭工具,具备通用性。马斯克说 2040 年地球上要有 100 亿台人形机器人,那时它们要走进各种工位和环境工作,只有人形机器人能适配人类社会的各种工具。OpenAI 总裁格雷格·布罗克曼认为未来机器人都是“通用人形”形态,因人类基因里希望创造人形态物种。不管从现实还是哲学角度,人形机器人都是具身智能的最终方向。

漫长的人形进化史

科技幻想归幻想,实际开发人形机器人并不容易。人类攻克人形机器人近 60 年,到 2025 年才算得上“人形机器人元年”。世界上最早的人形机器人来自日本,1967 年早稻田大学研发出 WABOT- 1 的 WL- 5 号两足步行机,虽现在看很“简陋”,全身仅 26 个关节,金属架多,行动能力仅一岁婴儿水准,走 10 公分左右需三人操作 45 秒,但这是“人形机器人·初号机”。之后,受科技进度限制,复杂人形机器人被遗忘,企业转向研究四足和履带机器人,因其站得“更稳”,重心易保持在支撑面内,人形机器人属双足机器人,支撑面积小,重心超出支撑面易摔倒,这一停滞就是 40 多年。直到 1992 年波士顿动力实验室的双足机器人在特制跑步机上迈出第一步,2013 年波士顿动力 Atlas 人形机器人首次亮相并解锁“直立行走”,还学会翻跟头、跳舞,但至今未进入商用阶段,因其无法胜任工作场景,象征意义大于实际意义。从 1967 年开始,人形机器人一直在找更聪明的“大脑”,2023 年 ChatGPT 点燃“人工智能”火焰,机器人企业兴奋不已,人形机器人找到真正智能的“AI 大脑”,嵌入大模型交互后,感知、决策和行动能力提升,投喂数据后能持续学习,人形机器人终于开始像样子了。

大脑、小脑和本体

找到“AI 大脑”后,人形机器人进步飞速。2024 年,OpenAI 与机器人创企 Figure 合作发布内置 ChatGPT- 4 的 Figure 01 人形机器人,成为世界上第一个拿起苹果的机器人。2025 年,春晚舞台上扭秧歌的“秧 Bot”让宇树成为资本宠儿。过去一年,具身智能赛道火热,融资金额高达 119.15 亿元,发生 188 起投融资事件,宇树、众擎等大量机器人企业借此崛起。人形机器人市场火热意味着产品更复杂。2025 年,人形机器人进一步细分,将“AI 大脑”拆解成大脑、小脑和本体。大脑指机器人的理解能力,即对人类指令的理解和环境感知;小脑是精细化运动控制能力;本体是构成人形机器人原型的各类零部件,如关节、四肢、头等,还需机器人专用的通用 AI、视觉传感器、触觉传感器、力觉传感器等一系列复杂零部件。显然,距离人类通往人形机器人的门槛还有很多,但量变终会引发质变,下一个人形机器人的技术奇点相信不远。

正文完
 0