AI大模型浪潮下的动荡与洗牌

84次阅读

共计 2946 个字符,预计需要花费 8 分钟才能阅读完成。

转眼间,ChatGPT 掀起的 AI 大模型浪潮已过去两年,然而人们期待的巨大商机却迟迟没有出现。与去年的一片叫好不同,AI 大模型创业如今正进入动荡期。今年下半年以来,国内 AI 圈可谓动荡不安,大神们、各家大厂大模型团队的核心技术骨干离职消息频繁传出。先是零一万物技术联创黄文灏离职,接着阿里通义千问技术负责人周畅转投字节,腾讯混元技术负责人刘威、昆仑万维 AI 专家颜水成等人也都离开了原公司。

人才流动向来是 AI 行业发展的风向标。这些技术骨干离职的背后,是 AI 大模型面临着技术迭代放缓以及商业化不理想等多重挑战,所有人都在主动调整,试图寻找自己认为正确的路线或方向。处于发展迷茫期的 AI 大模型行业,正在经历技术、资本与人才的重组,一场洗牌正在悄然发生,而且未来行业整合的趋势会越来越明显。

实际上,这样的故事在每次技术浪潮中都会上演。行业内有一个共识,那就是在经历一番激烈角逐后,未来能扮演重要角色的大模型公司将只剩下个位数,只有那些深度参与独角兽发展的人,才有可能成为最后的幸运儿。这是一场结果无法预测的残酷竞赛,身处其中,人们只能全力以赴。

在前沿技术的比拼中,人才无疑是最重要的竞争力。在技术飞速迭代的 AI 大模型领域,人才更是底层技术、产品能否跟上脚步,最终跻身行业第一梯队的关键因素。多位投资人表示,在这轮 AI 大模型浪潮中,他们考察投资项目时最看重的就是人才团队,因为这决定了项目是否有持续的技术迭代能力。

然而,不管是在大厂还是 AI 创业公司,前期热潮中聚拢来的人才,正因为现实的冲击而主动或被动地做出新的选择。据确认,腾讯杰出科学家、腾讯混元大模型技术负责人之一兼 AILab 计算机视觉中心负责人刘威近日已从腾讯离职。有消息称,刘威已经在新加坡创业,目标还是视频生成领域。前不久,昆仑万维也宣布颜水成不再担任其 2050 全球研究院院长,改任昆仑万维荣誉顾问。颜水成作为计算机视觉和机器学习领域专家,去年 9 月才加入昆仑万维,帮助其从 0 到 1 搭建了 2050 全球研究院,并围绕下一代模型架构和 Agent 两个方向展开了深度研究。

在这波人才动荡中,更多的人选择从 AI 创业公司流向大厂,或者从一个大厂转向另一个大厂。目前来看,下半年传出在积极筹备大模型研究院的字节跳动,是这波人才流动中的最大赢家。面壁智能秦禹嘉被曝离职后,于 2024 年下半年加入字节跳动大模型研究院;今年 8 月,零一万物技术联创黄文灏加入字节跳动的模型算法团队 Seed,向字节跳动大模型负责人朱文佳汇报;阿里巴巴通义千问大模型技术负责人周畅在 10 月份也被曝加入字节跳动。值得一提的是,周畅的离职还引发了诉讼。11 月 13 日,有消息称周畅违反竞业协议,阿里方面已起诉并递交劳动争议仲裁申请书。

前不久,月之暗面创始人杨植麟谈及一些人才回流大厂的现象时表示,这是正常的。他说:“行业发展进入了一个新的阶段,一开始有很多公司在做,现在变成了少一点的公司在做,接下来大家做的东西会逐渐不一样,我觉得这是必然的规律。”

大模型的训练投入巨大,即便是大厂也必须做出取舍。年初“文生视频”模型 Sora 的出现一度掀起全球竞逐 AI 视频生成的热潮,然而,OpenAI 宣布由于算力短缺而推迟 Sora 的更新,导致至今尚未对外开放。显然,在明确落地场景和商业化回报之前,“类 Sora”的视频生成模型也不会成为腾讯重点发力的方向。在此背景下,想要在视频生成领域有所作为的刘威自然会另谋出路。

有国内大厂投资负责人表示,海外今年也频繁出现人才流动的情况,主要原因还是 AI 大模型团队面临短期技术瓶颈以及商业化缓慢的挑战。未来,国内一大批 AI 初创企业将会面临资金链断裂以及被大厂收编的命运。此外,香颂资本执行董事沈萌指出,人才流动频繁的背后,一方面是国内大模型缺少深度研发创新,使得各团队之间的人员流动障碍更小;另一方面也折射出行业性的躁动,以及在模型数量上存在泡沫。

人工智能作为一门学科诞生至今已有超过 60 年,期间曾掀起过多次技术浪潮,在一些浪潮初期,也曾像这次 AI 大模型一样火热。在 2016 年掀起的那一轮 AI 浪潮初期,科技公司们也是想尽办法抢夺 AI 顶尖人才。但资本的耐心远远不足以支撑 AI 科学家的研究,当 AI 技术迟迟无法带来商业兑现时,不管是互联网大厂还是明星 AI 公司,都开始回归理性,重新评估 AI 人才的“价值”,人才流动也变得更快。

历史总是惊人的相似,经过一段时间的热潮后,AI 大模型行业也会进入挤压出清阶段。2022 年 10 月,ChatGPT 掀起了全球 AI 大模型浪潮,在国内更是引发百模大战,创业公司如雨后春笋般崛起,互联网大厂纷纷下场,喊出要“All in AI”的口号。然而经过过去一两年的探索,越来越多企业深刻认识到,能够熬到最后的幸运者只是少数。

百度创始人李彦宏此前直言,就像历史上许多次技术浪潮一样,在度过最初的兴奋阶段之后,生成式 AI 的技术泡沫不可避免。当这项技术没有达到最初兴奋阶段的高期望时,人们就会感到失望。李彦宏预判,在 AI 挤泡沫阶段,那些无法满足市场需求的伪创新将会被清洗掉,之后,有 1% 的企业将脱颖而出,继续成长,为社会创造巨大价值。“现在,我们只是在经历这个阶段,这个行业比去年更冷静,也更健康。”

所有 AI 大模型团队都站到了做取舍的十字路口。国内大模型行业上半年最热闹的是降价潮,在智谱 CEO 张鹏看来,这一现象是因为大家找不到差异化的价值点,只能比拼价格。张鹏透露,最近看到很多自研大模型的行业龙头公司开始掉头,因为他们发现这件事没那么容易,不是组建一个团队,拿一个开源模型过来就能跑通的,不如去采购。

此外,十月初,市场传出消息,称智谱 AI、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰这六家被称为“AI 六小虎”的公司中,有两家已经决定逐步放弃预训练模型,缩减预训练算法团队人数,将业务重心转向 AI 应用。杨植麟认为,预训练还有半代到一代的空间,这个空间明年会释放出来,明年领先的模型会把预训练做到比较极致的阶段。接下来最重点的是强化学习,它还是 Scaling,只是通过不同的方式去 Scale。

与此同时,月之暗面也主动选择做业务减法,聚焦把一个业务产品做好。杨植麟透露,月之暗面会根据美国市场的情况去判断,哪个业务最后做大的概率更高。聚焦在上限最高的事情,也要跟 AGI 的使命最相关。

AI 研究的终极目标是实现通用人工智能(AGI)。腾讯机器学习平台总监康战辉表示:“罗马一直在,路怎么走是不一样的。”他还说,AGI 大家都有思考,未来两年三年之后算是比较好规划,但未来各家可能走的路线不一样。比如,腾讯就选择了走混合专家模型(MoE)结构这一路线。

然而,无论路线如何选择,所有 AI 淘金者面临的一个共同难题,就是高算力带来了高成本,但是短期内没有出现可以覆盖高昂成本的商业变现路径。香颂资本执行董事沈萌表示,大模型短时间后会进入一次优胜劣汰的阵痛期,部分向核心技术底层推进的技术和产品更有机会获得市场认可。

这是一场百年难得一遇的科技革命,但没有足够成熟的技术和可靠的商业模式支撑,AI 大模型也难免像前几年的 VR、元宇宙一样,热潮退去,一地鸡毛。如今淘汰赛已经开启,在“AI 的 iPhone 时刻”来临之前,所有公司都要拿出足够的耐心和极高的敏锐度,去迎接残酷的挑战。

正文完
 0