共计 5822 个字符,预计需要花费 15 分钟才能阅读完成。
伴随着 AI 大模型的新一轮进化,这个夏天,人工智能正在引领一波新的热潮。
美国当地时间 6 月 18 日,AI 大模型的主要显卡芯片供应商英伟达收涨 3.51%,市值升至 3.34 万亿美元,一度超越微软和苹果等科技巨头,成为全球市值最高的上市企业。从 2022 年 11 月末 ChatGPT 发布算起,英伟达市值已上涨 9 倍以上。
5 月至今两个月以来,围绕 AI 大模型,一个月内十几场发布会,每一场都极具科技含量:国际市场,AI2.0 时代的开创者 OpenAI 公司公布了 ChatGPT-4o,AI 大模型概念的提出者谷歌,以及微软、Facebook 母公司 Meta,都有新发布;6 月 11 日,苹果推出 Apple Intelligence,其缩写还恰好与 AI 一模一样。在中国,从腾讯、阿里巴巴到字节跳动,也进行了新发布。
这十几场发布会,每一场都极具科技含量。梦幻的场景,激昂的演讲,全世界都在倾听。
然而,人们兴奋着,也失望着。
兴奋的是,重要性堪比电的发明,对人类影响可能比互联网、移动互联网更大的 AI,依然在进化、突破,快速接近着人类智能。失望的是,被寄予厚望的 AI 大模型离期望值依然较远,其应用水平仍在人类初级助手里打转。
或许,是时候冷静盘点一下 AI 大模型了。
作为经常用来与 AI 类比的互联网和移动互联网,起码应该具备三个特点:一是拥有海量的大众用户,二是在企业端、政府端被广泛应用,三是成为社会基础设施并带来极大的经济效率提升。更直观地看,互联网、移动互联网都催生了经济新形态,产生了微软、谷歌、亚马逊、苹果、腾讯、阿里巴巴、百度和华为等现象级科技企业,数十亿的现代人接受着这些科技巨头的服务。
从以上三个角度看,从 2022 年 11 月 30 日 ChatGPT 发布至今,AI 大模型在爆火并持续进化一年半之后,其应用水平或者说被接受程度远未达预期,只能说还在发展初期。最为用户接受的 ChatGPT,其日活量在尝鲜期过后,下降较快。业内公认的是,迄今为止,没有任何一款 AI 大模型的应用或产品的使用能达到流行的移动应用水平。
有悲观的业界声音开始发出,代表着 AI2.0 时代开启的 AI 大模型,或许依然不会带来真正的 AI 爆发,这有可能就像十多年前计算机视觉潮(同为 AI 技术潮)一样,潮来,也将潮去。要迎来比肩互联网和移动互联网的 AI 爆发,人类或许还需要等待更多时间。
近日,蚂蚁集团 CTO 何征宇的“钻木取火”观点在业内广为流传。他在蚂蚁技术日上公开表示:AI 发展目前还处于钻木取火阶段,尽管我们能够利用 AI 技术,但还没有找到最高效办法,仍然没有找到 AI 的本质。
这并非危言耸听,事实上,创造了 AI 大模型 Transformer 架构的谷歌,其 CEO 桑达尔·皮查伊近日受访时也表示:AI 浪潮仍处于早期阶段。在本轮 AI 热潮中再次创业的李开复也表示“感觉 AI 发展仍处早期”。
当然,更多 AI 领域专家认为,即使 AI 大模型不是 AI 爆发的终级形态,但它带来的数字化浪潮和潜力,依然具有想象力。
“AI 对于人类来说,一定是和人类发明了电一样的级别。AI 大模型,一年前我曾认为它拥有和互联网、移动互联网一样的级别,现在觉得当时有些乐观了。但是,AI 大模型依然代表迄今 AI 技术发展的最高点,只不过我们需要回归理性去看待它。让大模型做它能做到的,让它进步化得更智能、更有用,它依然具有很大的空间。”第四范式总裁胡时伟的话,具有代表性。
杀手级 AI 爆款应用并没有出现
全世界一直在思考,互联网、移动互联网之后,下一个对人类产生划时代影响的技术是什么?大数据、云计算、区块链、元宇宙、人工智能 AI 都曾在候选名单之中。AI 就是近年的新晋胜者,几乎获得科技界一致认同。
“我认为,人类未来回望历史,AI 技术的地位一定是超过互联网和移动互联网的。互联网没有智能,AI 可以产生类似人的智能这一点已经被确认,因此它为人类带来变革的想像空间更大。”这是一位资深行业研究者的话,在采访中,被其他受访对象广泛认同。
在深入讨论 AI 之前,可以略回顾一下互联网和移动互联网给人类带来的改变。
互联网和计算机一起,给人类带来了第三次工业革命即信息革命。互联网诞生至今 50 多年,几乎完成了全世界普及,给全球绝大部分个人、企业和政府机关的生活、生产和运行,带来了几何级别的便利。以微软为代表的大量专业软件系统供应商崛起,谷歌、亚马逊等搜索类、电商类企业崛起。
将移动通信和互联网二者结合起来的移动互联网,在 2010 年前后与智能手机结合,迎来爆发。在不到 10 年的时间内,移动互联网对全球大部分个人完成覆盖,大量企业和政府端为完成 To C 服务,进行了移动互联网变革。在中国,大部分 60 岁以上老人近年也成为智能手机用户。
全球范围内,崛起于互联网时期的科技企业,几乎全部利用移互技术进行升级,新出现了 Facebook、YouTube、微信、抖音、淘宝等 10 亿级用户移动应用。移动互联网还催生了移动支付、共享经济、数字政务等,初步带来便捷的数字生活、生产方式。
AI 技术的提出时间在 1956 年,甚至比互联网诞生的 1969 年都要早 13 年。长期以来,AI 都是一门被认为重要但难得其法去使用的技术。
2013 年至 2017 年,第一轮 AI 技术热潮——计算机视觉热潮掀起。在这轮热潮中,2016 年,谷歌的 AlphaGo 成为第一个战胜围棋世界冠军的人工智能机器人,我国的“AI 四小龙”——依图、商汤、云从、旷视诞生。但该轮热潮最终未能带来 AI 的爆发,大量资本投资失利,大量创业者艰难维持。
2022 年 11 月 30 日,ChatGPT 横空出世,基于 Transformer 架构的 AI 大模型自此被捧为 AI 技术的新未来。
人类通过 20 余年的继承式学习,才能具有一项或多项专有技能,胜任生活中各种角色,而人工智能则通过数月甚至更短时间的数据训练,拥有比人高得多的技能甚至是智能。
ChatGPT 引发的震撼则是全方位的,机器通过类似人的神经网络一样的学习方式,将所见、所听、所看结合既有数据、记忆,在瞬间进行成千上万的并行计算,再以文本、图表、语音、视频等方式表达出来。似乎,人之所以为人的知、情、意,人工智能除了情、意之外,在认知的数量方面超过和碾压人类,质量方面正无限接近人,甚至是超过多数人。
至今,全球大多数科技企业均涉足 AI 大模型发展和训练,作为科技突出国家的美国和中国,更是各自诞生数百个大模型。这被形象地称为“百模大战”,甚至“千模大战”。
大量的资本冲向 AI 领域,席卷全球的 AI 热潮再次涌起。一年半的喧闹之后,人们蓦然回首,与投资端的喧闹相比,市场对 AI 大模型的热情,还远远不及互联网、移动互联网。
除了训练 AI 大模型需要巨量 GPU 芯片,因此将芯片企业英伟达一度送上全美市值第一宝座外,这轮热潮下还没有诞生新的科技巨头。全球最好的 AI 大模型 ChatGPT 的日活至今只有数千万,国内大模型应用虽然均呈现向好态势,但 C 端日活和 B 端尝鲜者数量均不理想。
至今,全行业都在追问:杀手级、现象级或者说爆款 AI 应用,何时会出现?简单的问题,直击灵魂。业内回答,乐观者说 1 年内,中观者说 2 至 3 年,悲观者说“无法预计”。
6 月 13 日,北京智源人工智能研究院院长王仲远接受媒体群访时说,回顾移动互联网时代或更早期的技术革命,每次新技术的出现都需要一定的周期,包括技术能力的提升、成本的降低以及硬件的支持。当这些条件具备时,能够解决真实用户需求的 C 端爆款应用才会出现。“因此,对于 C 端爆款应用,我们还需保持一定的耐心。未来,我们可能会先从 B 端看到非常好用的工具,然后 C 端应用会逐步出现。”
AI 大模型峥嵘初显
尽管可以说 AI 至今还不能与互联网、移动互联网的技术地位类比,但谁也没法否认 AI 大模型带来的数字化潜力。“人工智能 +”的时代,确实是到来了。
市场研究机构 Gartner 分析师张桐告诉:“近期的 AI 领域一系列发布,还是带来了一些惊喜。一是在多模态方面进步巨大,OpenAI、谷歌、微软的最新发布,均强调了处理图像、语音的多模态能力,这与之前主要在文本处理方面的进步,有显著区别,十分关键。二是中国各家企业的 AI 大模型发布,显示的技术进步程度表明中国没有被美国明显拉开。”他特意提到了美国斯坦福大学 AI 团队被证实套壳抄袭国内清华与面壁智能团队的 AI 大模型。
从中国老百姓的角度,也可以从多个方面感受到 AI 大模型的扑面春风。
首先,我们熟悉的各类应用 APP,正在被 AI 入驻甚至“爆改”。百度搜索关键词的结果,第一条不再是互联网广告或百度词条,而是文心一言大模型给出的智能回答。微信也嵌入了元宝小程序,用户可以进行 AI 搜索、文档总结、AI 作图等应用。淘宝的“淘宝问问”可以用语言方式与用户交互并推荐商品。金融应用支付宝,只要下拉首页,就可以领取并使用 AI 金融助理、生活助理。
多位业内人士认为,虽然将 AI 大模型应用于传统 APP 只是大模型比较简单的初步应用,但这种趋势将继续,并且逐步向深度应用发展。这对公众直观认识 AI 大模型还是较为有用。
第二个变化是 AI 大模型正成为人们的工作和生活助手。文本能力方面,AI 大模型能力进化最大,已达到上下文数百万至 1000 万汉字的水平。因此,多数大模型应对文本、文档、书籍的要点总结,简单文章生成和 PPT 制作等,已显得轻松。音频转文本、视频生成等多模态能力,已让短视频创作的效率明显提高。
第三个变化是 AI 大模型开始入驻手机。6 月 11 日,苹果 2024 年全球开发者大会宣布苹果智能 (Apple Intelligence) 系统适用于 iPhone、iPad 和 Mac 等操作系统。会后产生了民间新梗“Siri 终于成了人工智能,不再是人工智障了”。苹果 AI 发布,使世界大致感知到了 AI 大模型手机的雏形,AI 获得类操作系统的权限,可以跨 APP 调用、统合信息,包括通讯录等隐私信息,最终可以告知你“我太太的航班几点降落”。
瑞银近期的一项预测是,生成式 AI 智能手机将从 2023 年的 5000 万部稳步增长,至 2027 年将达到 5.83 亿部,且到 2027 年收入或达 5130 亿美元。
下一步 AI 大模型场景或是汽车。4 月,一年一度的北京车展举行,展会的最大亮点并不是 117 款新车型全球首发,而是 AI 大模型“上车”。据不完全统计,已有 20 家左右的汽车品牌宣布 AI 大模型正式“上车”。
未来,AI 上车后大致的场景是:司机可以用自然语言与汽车进行交互,如“打开一半的右边窗户”“空调开到 23 度”,还可以问“现在堵车的原因是什么”。当然,也要预防坏人提出的“打开车门”要求。
千行百业尝鲜 AI 大模型
今年 4 月初,阿里巴巴宣布入职一位“AI 员工”——程序员通义灵码,其将担任阿里云代码助理,它具备扎实编程基础和 200 多种编程语言技能,可优化代码、生成测试框架和用例,提高工作效率。它也背了阿里的 KPI:未来 20% 阿里云代码将由其编写。
事实上,AI 员工现象,已是全球科技企业常态。高度规则化的程序编写,正是 AI 大模型最擅长的工作之一。
AI 客服是当前行业公认的最适合落地 AI 大模型的领域。近年第一代智能客服是生活中的槽点,相声、小品、脱口秀中诞生了大量的梗,我们不少人也对其狂喊过“请转人工”。AI 大模型加持的智能客服显然会更加智慧,在猜你想问、推你所推方面会更加精准。
值得一提的是,随着数字经济的推进,发达国家、地区以及近年的各行各业均在主动或被动地推进数字化进程。AI 大模型的出现,客观上对这一进程起着巨大助力作用。例如,阿里巴巴官方资料显示,其大模型已经在汽车、航空、天文、矿业、教育、医疗等行业落地,解决各行各业实际面临的具体问题。例如,在重工业领域,一汽集团联合阿里云打造了汽车行业首个大模型 BI 应用——GPT-X,通过智能化数据治理和商业分析能力,助力一汽提升决策效率。
王仲远认为,2023 年之后,人工智能逐步进入通用人工智能时代,其最大的特点是泛化性、通用性和跨领域的特性,这将影响所有行业。一些行业受到的影响会更快,比如大模型在生成摘要方面效果非常好,因此对所有与文书相关的工作、文案处理等效率提升作用显著。再比如,当前的文生图、文生视频技术,虽然还处于早期阶段,但都是提升效率的工具。“只要与这些能力相关,各行各业都会受益,并且未来会不断出现好用的工具。”
业内专家同时普遍认为,目前 AI 大模型在大量行业的应用,还处于初级阶段,还不够智能。“可以起到一些效率提升作用,是智能助手,但带来革命性变化,还谈不上。”张桐说。
AI 爆发或需更多等待
业内的一个共识是,从各方面看,AI 技术可能已经接近首次爆发。但无法排除的可能是,AI 也有可能需要一个更长的周期才能迎来爆发。
无论如何,有几个现实是 AI 大模型当前发展不容回避的。
首先,AI 大模型十分烧芯片、烧数据,甚至烧电力。每一个大模型动辄需要上万块英伟达 GPU,每块价值 1 万至 1.5 万美元以上。每次训练还需要规模达百亿、千亿级 TOKEN 的数据物料,无论英文数据物料还是中文数据物料,现有物料都难以接续。
很难想象,大模型的耗电量会成为能源专家的最新关注点。训练 Open AI 的 GPT- 3 模型耗电量相当于 120 个美国家庭一年的用电量。在这背后,大模型的 CPU(中央处理器)和 GPU(图形处理器)等硬件在执行复杂计算时会消耗大量电力,同时大模型所需巨大内存带来的读写操作,同样需要电力。“这样集中、持续、稳定供应电力的地方并不好找,在这方面,中国的电力基础设施将比美国更容易支持本国的 AI 大模型发展。”张桐说。
相比动辄数十亿级别的投入,AI 大模型带来的收入还十分有限,甚至暂时可以忽略。
其次,AI 大模型还有“硬伤”,即不够靠谱的问题仍然没有解决。虽然大部分时候,AI 大模型的推理和判断结果令人欣喜,但时而“一本正经地胡说八道”还是会出现。目前任何大模型都不能幸免。在生活中,AI 大模型的错误我们可以容忍,可以一笑置之,但这却关乎大模型商用的前途,例如金融系统和制造业的容错空间就极小。
再次,AI 大模型目前的使用门槛还比较高。除了核心功能价格不够普惠外,内行与外行的使用效果差别明显。大多数模型的使用需要进行专门培训。而一个改变人类的基础技术,最终一定是像互联网一样低门槛的。
“AI 技术已发展了 30 年,现在说它还处于钻木取火阶段可能有些夸张,但它仍然处于技术早期这不可否认。”一位大厂的 AI 专家表示。
科学技术发展带有不可确定性,没有人是先知。或许,AI 爆发只差临门一脚。又或许,AI 大模型并不是 AI 爆发的最终解。那么,我们可能需要继续等待。