AGI通用人工智能：改变未来生活的科技力量

235次阅读

共计 2452 个字符，预计需要花费 7 分钟才能阅读完成。

在科幻的奇妙世界里，AGI 通用人工智能正一步步走来，准备改变我们的未来生活。

在 2021 年上映的科幻片《失控玩家》中，主角 Guy 本是游戏里按固定程式运作的 NPC，某天突然有了人的意识，开始自主感受、思考、决策，甚至谈起了恋爱。近年来，以数字意识觉醒为主题的优秀作品不少，如《爱、死亡和机器人》第一季中的 Zima，从清理泳池的机器逐渐拥有人的意识并成为艺术家；《西部世界》里人类高科技乐园中的机器人接待员自我觉醒，想摆脱控制。这些神奇机器人并非天方夜谭，在科技创新前线，众多科研人士和公司正致力于推动 Artificial General Intelligence（AGI）通用人工智能的实现。

AGI 被称为通用人工智能，定义虽无特别严格准确的标准，但一般指具备或超越人类智慧的机器智能，能表现人类所有智能行为，也叫“强人工智能”，与之对应的是弱人工智能。人工智能研究者普遍认为，通用人工智能需有自动推理、知识表示、自动规划、自主学习创新、自然语言理解及沟通等特质，还要整合这些手段达成目标，其目标是赋予智能体人的智慧，让机器像人一样思考和行动。

2016 年 3 月 9 日至 15 日，Google 旗下的 DeepMind 智能系统 AlphaGo 在韩国首尔对战世界围棋冠军李世石，最终以 4 比 1 获胜。2017 年 5 月 23 日至 27 日，柯洁与 AlphaGo 进行“人机大战 2.0”三番棋较量，柯洁 0:3 败北。AlphaGo 的胜利将 AGI 的技术前景直观展现。围棋虽有难度，但与现实世界差异大，现实生活是物理多维、动作复杂的。

攻克围棋比赛后，AGI 在游戏领域大放异彩。2019 年，DeepMind 打造的 AlphaStar AI 通过算法训练，在《星际争霸》游戏中战胜欧洲职业冠军。与围棋不同，游戏有故事背景、角色人物，需使用技能道具，采用复杂策略击败别人，这体现出 AGI 不断升级的技术能力。

AGI 是人工智能的分支，在互联网发展早期以大数据 / 机器学习为人所知。中国的启元世界是 AGI 技术代表公司，2020 年 6 月，其自主研发的 AI 智能体在《星际争霸 II》人机大战中击败中国星际职业冠军级选手，成为国内首个在公开比赛中战胜顶级职业选手的星际 AI，与 DeepMind 成为全球唯二能用 AI 击败星际顶级选手的公司，技术能力广受认可。

据启元世界创始人兼 CEO 袁泉介绍，基于大数据和监督式机器学习的 AI 会使用已有标注数据，如电商平台的点击购买数据、人脸识别领域的标注数据等。大数据和机器学习要解决在已有标注数据下训练模型的问题，让模型找到关键特征拟合标注数据，新数据产生时用于判断用户行为。这一套大数据能力在互联网上产生了搜索、推荐和广告等商业价值落地场景，袁泉曾在阿里打造全球电商最大的个性化产品“猜你喜欢”的技术体系。

但这种机器学习方式有局限性，需要大量标注数据，存在时间和效率成本，很多场景无法通过数据标注判定，需 AI 根据不同环境智能决策。AlphaGo 刚出现时使用人类棋谱数据，到第二代 AlphaGoZero 则完全不用人类棋谱，通过算法让两个 AI 左右互搏生成新棋谱和数据。

AlphaGo 的技术演进显示了 AI 能力的两种范式。第一种解决已有标注数据训练更准确模型的问题；第二种范式更复杂，需解决生成高质量数据、训练聪明 AI 神经网络、让聪明 AI 生成更高质量数据以训练更高水平 AI，呈现螺旋式进化，其背后的技术是强化学习，是实现 AGI 的必要手段之一。强化学习是解决智能决策问题的算法框架，不需要数据标签，核心是让 AI 与环境交互、试错改进，基于环境行动取得最大化预期利益，灵感来源于心理学中的行为主义理论。

在 AGI 领域，2010 年创立的 DeepMind 公司是先行者。2014 年开发人工智能围棋软件 AlphaGo，2016 年击败李世石而闻名。还研发出应用于蛋白质折叠领域的 AlphaFold，2018 年赢得第 13 次蛋白质结构预测技术关键评估。2019 年推出玩即时战略游戏星际争霸的 AlphaStar，使用基于人类玩家回放的模仿学习，然后用深度强化学习与自己对战增强技能，战胜了世界冠军。

在中国，2017 年成立的启元世界一直在 AGI 领域探索。创始人兼 CEO 袁泉曾在阿里打造“猜你喜欢”技术体系，是阿里算法团队技术大牛，还曾在 IBM 中国研究院任研究员等；CTO 龙海涛曾在阿里巴巴负责搜索广告业务架构设计，也曾是 IBM 研究院最年轻的科学家。

袁泉认为，在 AGI 技术探索上，提升智能体三方面能力很重要。一是全面提升智能体的 IQ 能力，用《星际争霸》训练 AI，验证其 IQ 可大幅超越人；二是提升智能体的 EQ 能力，使其能将情感、互动和社交有效传递给人，目前启元世界的智能体已能和人做初步语言交互；三是增强智能体与人交互的可解释性，虽深度学习技术偏黑盒，但有越来越多手段将智能体学习过程和能力外化显示，便于各行业应用 AI 时建立信任。

目前，游戏领域是启元世界最核心的商业化落地场景。在《星际争霸》中构建的神经网络放到回合制策略游戏中，智能体可自行适应。不同游戏场景复杂，传统 AI 技术难用一套模型算法适配，但启元世界认为训练一套 AGI 算法方案就能在有限时间和算力内找到数据最优解，完成数值平衡设计，提升游戏 AI 研发效率和质量。

在游戏行业外，随着智能体 IQ、EQ、与人交互可解释性不断提升，未来它们将成为元宇宙重要组成部分，甚至是虚拟世界新物种和原住民。当 IQ 能力超越人时可帮助学习培训；EQ 方面能更好关怀别人，提供陪伴温暖，是元宇宙重要核心体验。除构建数字世界体验，AGI 更重要的价值是通过元宇宙、数字孪生、AI 的虚实迁移能力赋能现实世界，如将神经网络迁移到各类机器人上，提升现实生活效率与体验。

“元宇宙不止于数字娱乐，更应是人机共生共创的精神家园。未来元宇宙中，最令人期待的是基于 AI 的硅基生命与人这类碳基生命有机协作，开创全新学习与生活体验。”袁泉乐观表示。期待随着科技发展，影视作品中拥有人类智慧的智能体走入生活，让世界更丰富多元。

正文完