探寻人形机器人：是必然方向还是漫长征途？

56次阅读

共计 1528 个字符，预计需要花费 4 分钟才能阅读完成。

2025 年，被称作“具身智能元年”，连政府工作报告中都出现了“具身智能”和“智能机器人”。众多机器人开始在社交平台刷屏，像宇树机器人那套拳法耍得有模有样，众擎机器人在深圳湾与跑者同框竞跑。越来越多机器人进入大众视野，推动了相关企业市值与融资。然而，有个问题一直萦绕：为何所有机器人都是人形的呢？

大众对“机器人幻想”多源于好莱坞，斯皮尔伯格、詹姆斯·卡梅隆等导演眼中，机器人不是冰冷金属躯壳，而是有血有肉的生灵，它们不知疲倦、不断进步、感情更专注，还思考着哲学问题。于是，T-800 终结者、银翼杀手等都是类人形态。在电影影响下，大家觉得机器人首先要像人，起码会两条腿走路。在具身智能赛道里，人形机器人是最耀眼的存在。因为在物理世界，人类活动复杂多元，设施和工具多以人类使用为基础建造。人类期望机器人代替劳动，只有人形机器人能最大程度适应物理世界，无需改造世界来适应它。滚轮和履带速度虽快，但遇台阶咋办？四足虽站得稳，却缺“手”无法胜任人类工作。所以，把机器人设计成人形，拥有人的运动能力，才能更好适应环境、驾驭工具，具备通用性。马斯克说 2040 年地球上要有 100 亿台人形机器人，那时它们要走进各种工位和环境工作，只有人形机器人能适配人类社会的各种工具。OpenAI 总裁格雷格·布罗克曼认为未来机器人都是“通用人形”形态，因人类基因里希望创造人形态物种。不管从现实还是哲学角度，人形机器人都是具身智能的最终方向。

科技幻想归幻想，实际开发人形机器人并不容易。人类攻克人形机器人近 60 年，到 2025 年才算得上“人形机器人元年”。世界上最早的人形机器人来自日本，1967 年早稻田大学研发出 WABOT- 1 的 WL- 5 号两足步行机，虽现在看很“简陋”，全身仅 26 个关节，金属架多，行动能力仅一岁婴儿水准，走 10 公分左右需三人操作 45 秒，但这是“人形机器人·初号机”。之后，受科技进度限制，复杂人形机器人被遗忘，企业转向研究四足和履带机器人，因其站得“更稳”，重心易保持在支撑面内，人形机器人属双足机器人，支撑面积小，重心超出支撑面易摔倒，这一停滞就是 40 多年。直到 1992 年波士顿动力实验室的双足机器人在特制跑步机上迈出第一步，2013 年波士顿动力 Atlas 人形机器人首次亮相并解锁“直立行走”，还学会翻跟头、跳舞，但至今未进入商用阶段，因其无法胜任工作场景，象征意义大于实际意义。从 1967 年开始，人形机器人一直在找更聪明的“大脑”，2023 年 ChatGPT 点燃“人工智能”火焰，机器人企业兴奋不已，人形机器人找到真正智能的“AI 大脑”，嵌入大模型交互后，感知、决策和行动能力提升，投喂数据后能持续学习，人形机器人终于开始像样子了。

找到“AI 大脑”后，人形机器人进步飞速。2024 年，OpenAI 与机器人创企 Figure 合作发布内置 ChatGPT- 4 的 Figure 01 人形机器人，成为世界上第一个拿起苹果的机器人。2025 年，春晚舞台上扭秧歌的“秧 Bot”让宇树成为资本宠儿。过去一年，具身智能赛道火热，融资金额高达 119.15 亿元，发生 188 起投融资事件，宇树、众擎等大量机器人企业借此崛起。人形机器人市场火热意味着产品更复杂。2025 年，人形机器人进一步细分，将“AI 大脑”拆解成大脑、小脑和本体。大脑指机器人的理解能力，即对人类指令的理解和环境感知；小脑是精细化运动控制能力；本体是构成人形机器人原型的各类零部件，如关节、四肢、头等，还需机器人专用的通用 AI、视觉传感器、触觉传感器、力觉传感器等一系列复杂零部件。显然，距离人类通往人形机器人的门槛还有很多，但量变终会引发质变，下一个人形机器人的技术奇点相信不远。

正文完