AI大模型浪潮下的动荡与洗牌

100次阅读

共计 2946 个字符，预计需要花费 8 分钟才能阅读完成。

转眼间，ChatGPT 掀起的 AI 大模型浪潮已过去两年，然而人们期待的巨大商机却迟迟没有出现。与去年的一片叫好不同，AI 大模型创业如今正进入动荡期。今年下半年以来，国内 AI 圈可谓动荡不安，大神们、各家大厂大模型团队的核心技术骨干离职消息频繁传出。先是零一万物技术联创黄文灏离职，接着阿里通义千问技术负责人周畅转投字节，腾讯混元技术负责人刘威、昆仑万维 AI 专家颜水成等人也都离开了原公司。

人才流动向来是 AI 行业发展的风向标。这些技术骨干离职的背后，是 AI 大模型面临着技术迭代放缓以及商业化不理想等多重挑战，所有人都在主动调整，试图寻找自己认为正确的路线或方向。处于发展迷茫期的 AI 大模型行业，正在经历技术、资本与人才的重组，一场洗牌正在悄然发生，而且未来行业整合的趋势会越来越明显。

实际上，这样的故事在每次技术浪潮中都会上演。行业内有一个共识，那就是在经历一番激烈角逐后，未来能扮演重要角色的大模型公司将只剩下个位数，只有那些深度参与独角兽发展的人，才有可能成为最后的幸运儿。这是一场结果无法预测的残酷竞赛，身处其中，人们只能全力以赴。

在前沿技术的比拼中，人才无疑是最重要的竞争力。在技术飞速迭代的 AI 大模型领域，人才更是底层技术、产品能否跟上脚步，最终跻身行业第一梯队的关键因素。多位投资人表示，在这轮 AI 大模型浪潮中，他们考察投资项目时最看重的就是人才团队，因为这决定了项目是否有持续的技术迭代能力。

然而，不管是在大厂还是 AI 创业公司，前期热潮中聚拢来的人才，正因为现实的冲击而主动或被动地做出新的选择。据确认，腾讯杰出科学家、腾讯混元大模型技术负责人之一兼 AILab 计算机视觉中心负责人刘威近日已从腾讯离职。有消息称，刘威已经在新加坡创业，目标还是视频生成领域。前不久，昆仑万维也宣布颜水成不再担任其 2050 全球研究院院长，改任昆仑万维荣誉顾问。颜水成作为计算机视觉和机器学习领域专家，去年 9 月才加入昆仑万维，帮助其从 0 到 1 搭建了 2050 全球研究院，并围绕下一代模型架构和 Agent 两个方向展开了深度研究。

在这波人才动荡中，更多的人选择从 AI 创业公司流向大厂，或者从一个大厂转向另一个大厂。目前来看，下半年传出在积极筹备大模型研究院的字节跳动，是这波人才流动中的最大赢家。面壁智能秦禹嘉被曝离职后，于 2024 年下半年加入字节跳动大模型研究院；今年 8 月，零一万物技术联创黄文灏加入字节跳动的模型算法团队 Seed，向字节跳动大模型负责人朱文佳汇报；阿里巴巴通义千问大模型技术负责人周畅在 10 月份也被曝加入字节跳动。值得一提的是，周畅的离职还引发了诉讼。11 月 13 日，有消息称周畅违反竞业协议，阿里方面已起诉并递交劳动争议仲裁申请书。

前不久，月之暗面创始人杨植麟谈及一些人才回流大厂的现象时表示，这是正常的。他说：“行业发展进入了一个新的阶段，一开始有很多公司在做，现在变成了少一点的公司在做，接下来大家做的东西会逐渐不一样，我觉得这是必然的规律。”

大模型的训练投入巨大，即便是大厂也必须做出取舍。年初“文生视频”模型 Sora 的出现一度掀起全球竞逐 AI 视频生成的热潮，然而，OpenAI 宣布由于算力短缺而推迟 Sora 的更新，导致至今尚未对外开放。显然，在明确落地场景和商业化回报之前，“类 Sora”的视频生成模型也不会成为腾讯重点发力的方向。在此背景下，想要在视频生成领域有所作为的刘威自然会另谋出路。

有国内大厂投资负责人表示，海外今年也频繁出现人才流动的情况，主要原因还是 AI 大模型团队面临短期技术瓶颈以及商业化缓慢的挑战。未来，国内一大批 AI 初创企业将会面临资金链断裂以及被大厂收编的命运。此外，香颂资本执行董事沈萌指出，人才流动频繁的背后，一方面是国内大模型缺少深度研发创新，使得各团队之间的人员流动障碍更小；另一方面也折射出行业性的躁动，以及在模型数量上存在泡沫。

人工智能作为一门学科诞生至今已有超过 60 年，期间曾掀起过多次技术浪潮，在一些浪潮初期，也曾像这次 AI 大模型一样火热。在 2016 年掀起的那一轮 AI 浪潮初期，科技公司们也是想尽办法抢夺 AI 顶尖人才。但资本的耐心远远不足以支撑 AI 科学家的研究，当 AI 技术迟迟无法带来商业兑现时，不管是互联网大厂还是明星 AI 公司，都开始回归理性，重新评估 AI 人才的“价值”，人才流动也变得更快。

历史总是惊人的相似，经过一段时间的热潮后，AI 大模型行业也会进入挤压出清阶段。2022 年 10 月，ChatGPT 掀起了全球 AI 大模型浪潮，在国内更是引发百模大战，创业公司如雨后春笋般崛起，互联网大厂纷纷下场，喊出要“All in AI”的口号。然而经过过去一两年的探索，越来越多企业深刻认识到，能够熬到最后的幸运者只是少数。

百度创始人李彦宏此前直言，就像历史上许多次技术浪潮一样，在度过最初的兴奋阶段之后，生成式 AI 的技术泡沫不可避免。当这项技术没有达到最初兴奋阶段的高期望时，人们就会感到失望。李彦宏预判，在 AI 挤泡沫阶段，那些无法满足市场需求的伪创新将会被清洗掉，之后，有 1% 的企业将脱颖而出，继续成长，为社会创造巨大价值。“现在，我们只是在经历这个阶段，这个行业比去年更冷静，也更健康。”

所有 AI 大模型团队都站到了做取舍的十字路口。国内大模型行业上半年最热闹的是降价潮，在智谱 CEO 张鹏看来，这一现象是因为大家找不到差异化的价值点，只能比拼价格。张鹏透露，最近看到很多自研大模型的行业龙头公司开始掉头，因为他们发现这件事没那么容易，不是组建一个团队，拿一个开源模型过来就能跑通的，不如去采购。

此外，十月初，市场传出消息，称智谱 AI、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰这六家被称为“AI 六小虎”的公司中，有两家已经决定逐步放弃预训练模型，缩减预训练算法团队人数，将业务重心转向 AI 应用。杨植麟认为，预训练还有半代到一代的空间，这个空间明年会释放出来，明年领先的模型会把预训练做到比较极致的阶段。接下来最重点的是强化学习，它还是 Scaling，只是通过不同的方式去 Scale。

与此同时，月之暗面也主动选择做业务减法，聚焦把一个业务产品做好。杨植麟透露，月之暗面会根据美国市场的情况去判断，哪个业务最后做大的概率更高。聚焦在上限最高的事情，也要跟 AGI 的使命最相关。

AI 研究的终极目标是实现通用人工智能（AGI）。腾讯机器学习平台总监康战辉表示：“罗马一直在，路怎么走是不一样的。”他还说，AGI 大家都有思考，未来两年三年之后算是比较好规划，但未来各家可能走的路线不一样。比如，腾讯就选择了走混合专家模型（MoE）结构这一路线。

然而，无论路线如何选择，所有 AI 淘金者面临的一个共同难题，就是高算力带来了高成本，但是短期内没有出现可以覆盖高昂成本的商业变现路径。香颂资本执行董事沈萌表示，大模型短时间后会进入一次优胜劣汰的阵痛期，部分向核心技术底层推进的技术和产品更有机会获得市场认可。

这是一场百年难得一遇的科技革命，但没有足够成熟的技术和可靠的商业模式支撑，AI 大模型也难免像前几年的 VR、元宇宙一样，热潮退去，一地鸡毛。如今淘汰赛已经开启，在“AI 的 iPhone 时刻”来临之前，所有公司都要拿出足够的耐心和极高的敏锐度，去迎接残酷的挑战。

正文完