共计 2452 个字符,预计需要花费 7 分钟才能阅读完成。
在科幻的奇妙世界里,AGI 通用人工智能正一步步走来,准备改变我们的未来生活。
在 2021 年上映的科幻片《失控玩家》中,主角 Guy 本是游戏里按固定程式运作的 NPC,某天突然有了人的意识,开始自主感受、思考、决策,甚至谈起了恋爱。近年来,以数字意识觉醒为主题的优秀作品不少,如《爱、死亡和机器人》第一季中的 Zima,从清理泳池的机器逐渐拥有人的意识并成为艺术家;《西部世界》里人类高科技乐园中的机器人接待员自我觉醒,想摆脱控制。这些神奇机器人并非天方夜谭,在科技创新前线,众多科研人士和公司正致力于推动 Artificial General Intelligence(AGI)通用人工智能的实现。
AGI 被称为通用人工智能,定义虽无特别严格准确的标准,但一般指具备或超越人类智慧的机器智能,能表现人类所有智能行为,也叫“强人工智能”,与之对应的是弱人工智能。人工智能研究者普遍认为,通用人工智能需有自动推理、知识表示、自动规划、自主学习创新、自然语言理解及沟通等特质,还要整合这些手段达成目标,其目标是赋予智能体人的智慧,让机器像人一样思考和行动。
AGI 的技术演变
2016 年 3 月 9 日至 15 日,Google 旗下的 DeepMind 智能系统 AlphaGo 在韩国首尔对战世界围棋冠军李世石,最终以 4 比 1 获胜。2017 年 5 月 23 日至 27 日,柯洁与 AlphaGo 进行“人机大战 2.0”三番棋较量,柯洁 0:3 败北。AlphaGo 的胜利将 AGI 的技术前景直观展现。围棋虽有难度,但与现实世界差异大,现实生活是物理多维、动作复杂的。
攻克围棋比赛后,AGI 在游戏领域大放异彩。2019 年,DeepMind 打造的 AlphaStar AI 通过算法训练,在《星际争霸》游戏中战胜欧洲职业冠军。与围棋不同,游戏有故事背景、角色人物,需使用技能道具,采用复杂策略击败别人,这体现出 AGI 不断升级的技术能力。
AGI 是人工智能的分支,在互联网发展早期以大数据 / 机器学习为人所知。中国的启元世界是 AGI 技术代表公司,2020 年 6 月,其自主研发的 AI 智能体在《星际争霸 II》人机大战中击败中国星际职业冠军级选手,成为国内首个在公开比赛中战胜顶级职业选手的星际 AI,与 DeepMind 成为全球唯二能用 AI 击败星际顶级选手的公司,技术能力广受认可。
据启元世界创始人兼 CEO 袁泉介绍,基于大数据和监督式机器学习的 AI 会使用已有标注数据,如电商平台的点击购买数据、人脸识别领域的标注数据等。大数据和机器学习要解决在已有标注数据下训练模型的问题,让模型找到关键特征拟合标注数据,新数据产生时用于判断用户行为。这一套大数据能力在互联网上产生了搜索、推荐和广告等商业价值落地场景,袁泉曾在阿里打造全球电商最大的个性化产品“猜你喜欢”的技术体系。
但这种机器学习方式有局限性,需要大量标注数据,存在时间和效率成本,很多场景无法通过数据标注判定,需 AI 根据不同环境智能决策。AlphaGo 刚出现时使用人类棋谱数据,到第二代 AlphaGoZero 则完全不用人类棋谱,通过算法让两个 AI 左右互搏生成新棋谱和数据。
AlphaGo 的技术演进显示了 AI 能力的两种范式。第一种解决已有标注数据训练更准确模型的问题;第二种范式更复杂,需解决生成高质量数据、训练聪明 AI 神经网络、让聪明 AI 生成更高质量数据以训练更高水平 AI,呈现螺旋式进化,其背后的技术是强化学习,是实现 AGI 的必要手段之一。强化学习是解决智能决策问题的算法框架,不需要数据标签,核心是让 AI 与环境交互、试错改进,基于环境行动取得最大化预期利益,灵感来源于心理学中的行为主义理论。
探索 AGI:从 DeepMind 到启元世界
在 AGI 领域,2010 年创立的 DeepMind 公司是先行者。2014 年开发人工智能围棋软件 AlphaGo,2016 年击败李世石而闻名。还研发出应用于蛋白质折叠领域的 AlphaFold,2018 年赢得第 13 次蛋白质结构预测技术关键评估。2019 年推出玩即时战略游戏星际争霸的 AlphaStar,使用基于人类玩家回放的模仿学习,然后用深度强化学习与自己对战增强技能,战胜了世界冠军。
在中国,2017 年成立的启元世界一直在 AGI 领域探索。创始人兼 CEO 袁泉曾在阿里打造“猜你喜欢”技术体系,是阿里算法团队技术大牛,还曾在 IBM 中国研究院任研究员等;CTO 龙海涛曾在阿里巴巴负责搜索广告业务架构设计,也曾是 IBM 研究院最年轻的科学家。
袁泉认为,在 AGI 技术探索上,提升智能体三方面能力很重要。一是全面提升智能体的 IQ 能力,用《星际争霸》训练 AI,验证其 IQ 可大幅超越人;二是提升智能体的 EQ 能力,使其能将情感、互动和社交有效传递给人,目前启元世界的智能体已能和人做初步语言交互;三是增强智能体与人交互的可解释性,虽深度学习技术偏黑盒,但有越来越多手段将智能体学习过程和能力外化显示,便于各行业应用 AI 时建立信任。
目前,游戏领域是启元世界最核心的商业化落地场景。在《星际争霸》中构建的神经网络放到回合制策略游戏中,智能体可自行适应。不同游戏场景复杂,传统 AI 技术难用一套模型算法适配,但启元世界认为训练一套 AGI 算法方案就能在有限时间和算力内找到数据最优解,完成数值平衡设计,提升游戏 AI 研发效率和质量。
在游戏行业外,随着智能体 IQ、EQ、与人交互可解释性不断提升,未来它们将成为元宇宙重要组成部分,甚至是虚拟世界新物种和原住民。当 IQ 能力超越人时可帮助学习培训;EQ 方面能更好关怀别人,提供陪伴温暖,是元宇宙重要核心体验。除构建数字世界体验,AGI 更重要的价值是通过元宇宙、数字孪生、AI 的虚实迁移能力赋能现实世界,如将神经网络迁移到各类机器人上,提升现实生活效率与体验。
“元宇宙不止于数字娱乐,更应是人机共生共创的精神家园。未来元宇宙中,最令人期待的是基于 AI 的硅基生命与人这类碳基生命有机协作,开创全新学习与生活体验。”袁泉乐观表示。期待随着科技发展,影视作品中拥有人类智慧的智能体走入生活,让世界更丰富多元。