大厂AI焦虑:DeepSeek冲击下的变革与挑战

3次阅读

共计 4322 个字符,预计需要花费 11 分钟才能阅读完成。

大厂 AI,做得怎么样了?

在 DeepSeek 出现之前,大厂在 AI 领域的发展路线是高举高打、重投入,围绕自身优势打造产品。大模型作为 AI 行业的基础设施,受到众多企业的关注。互联网大厂如百度、腾讯、阿里、字节、快手等,消费电子厂商以华为为代表,智能语音厂商像科大讯飞等,纷纷推出了自研大模型。相较于“AI 六小虎”这类初创公司,大厂具备更雄厚的资金和人才储备。

从 AI 行业整体技术迭代速度以及各家公开信息来看,大厂大模型在底层技术上并无根本性差别,但在入场时间、模型定位、市场策略方面存在差异。

首先是入场时间。大模型发布时间的早晚,在一定程度上反映了大厂在相关技术领域的布局和积累情况。华为发布大模型的时间较早,不过其底层虽基于 Transformer 架构,但与 ChatGPT 式对话不同,属于 AI 大模型在“产业专用”方向,而 ChatGPT 式为通用智能。若聚焦通用智能大模型,百度行动较早,在 2023 年 3 月便启动了文心一言大模型的邀测(非全面开放)。然而,推出时间早晚并非衡量模型优劣的核心要素。

大厂的业务布局决定了大模型的应用方向,进而形成了不同的模型定位。从技术角度分析,这源于各家的训练数据。百度文心一言主要依靠互联网文本数据;阿里通义千问涵盖文本、图片、音频等多模态数据;腾讯混元基于社交网络和用户行为数据;字节豆包约 50%-60% 来自字节的自有业务(抖音、今日头条)数据;华为盘古大模型则运用了包含工业、气象、文图、图像在内的各类数据。这使得各家大模型的优势场景各异。例如,文心一言在长文本处理和多语种对话方面表现出色;混元在社交场景更具优势;豆包在生成内容和精准推荐上较为领先;通义千问在电商推荐场景响应更快;盘古执行速度和泛化能力出色,能高效应对大规模任务。可以看出,各家大模型的优势领域都与自身核心业务相关。

最后是市场策略,这在一定程度上体现了大厂对自身能力和行业趋势的判断。外界大致可以从开闭源以及 TO C 产品是否免费这两个方面进行观察。字节、快手、讯飞、华为目前坚持闭源,百度、腾讯、阿里则选择大部分开源。在 TO C 应用方面,百度、腾讯、阿里采取免费路线,字节、快手、讯飞多为用户提供有限次数的免费额度。阿里通过开源尝到了甜头,开源 AI 平台 Hugging Face 发布的最新开源大模型榜单显示,排名前十的开源大模型全部是基于阿里通义千问的衍生模型。在 TO C 产品中,坚持免费的豆包发展势头迅猛。根据 AI 产品榜显示,2025 年 1 月,豆包在国内千万月活俱乐部中排名第一,达到 7861 万,远超其他大厂应用。

不过,大家对大厂大模型整体能力的排名更为好奇。据多位从业者分析,目前大厂的顶级大模型多为闭源,在信息不完全透明的情况下,判断各家能力并非易事。弗若斯特沙利文在《2024 年中国大模型能力评测》报告中指出,百度文心一言、腾讯混元、阿里通义千问等大厂大模型都处于第一梯队,认为它们在技术能力上较为全面,用户量也相对较大。但对于哪家整体能力更为出色,报告并未给出明确判断。AI 软件工程师覃相表示,各家在技术架构和训练数据等方面存在差异。从技术架构来看,模型规模和参数量是衡量大模型复杂程度和能力的重要指标。一般而言,规模越大、参数越多,模型的学习能力和表达能力就越强。例如,DeepSeek-R1 被称作参数上的巨无霸,高达 6710 亿的参数构建了一个庞大的知识储备库。他还表示,从这一维度判断,在大厂的大模型中,具有深度推理能力的大模型,如文心一言在一众大厂中能力较强。但如果看垂直领域的能力,文心一言则比不上通义千问,毕竟后者开发并上线了基于自身的 8 个垂直领域模型。总之,各家大模型都有其优势,很难有一家在各个维度上都超越其他家。

DeepSeek 出圈 40 天,大厂四大转变

DeepSeek 的出现,促使大厂重新审视自身的 AI 战略布局。结合各家最新动态以及从业者的观点,具体有以下四大转变。

一是从闭源到开源,这是最为重大的转变。不止一位从业者指出,DeepSeek 的火爆与开源密切相关。此前,国内外对大模型开闭源的讨论从未停止,百度董事长李彦宏曾是闭源的坚定支持者,认为无论在保持技术领先性还是商业模式方面,闭源都优于开源。覃相从技术角度分析,开源意味着核心代码公开,竞争对手能够快速复现技术路径,大厂早期选择闭源主要是为了保护知识产权和商业壁垒(如 OpenAI 早期未开源 GPT-3)。但他发现,在 DeepSeek 的带动下,大厂已转变方向,更倾向于通过生态绑定(如腾讯混元开源视频模型,吸引开发者使用其云服务)实现长期收益,而非单纯依赖技术保密。如今,百度已宣布文心大模型 4.5 系列将于 2025 年 6 月底全面开源。截至目前,百度、阿里、腾讯的大部分模型都已开源或者宣布开源。

二是业务重点从 TO B 转向“双线并行”。覃相解释,大模型变现主要有增值服务、数据变现、合规服务三种方式,其中增值服务占比最大,依靠企业级定制与 API 调用收入。他透露,百度文心一言企业版年费超千万元,阿里云通义千问为政企客户提供定制化客服系统,单项目合同额可达数亿元。也就是说,大厂当前盈利仍主要依赖 B 端,但近期很多大厂开始重视 TO C 应用的推广,改为 TO B、TO C“双线并行”。例如腾讯加大对元宝的宣传,一方面将其接入微信九宫格,获得强流量入口,另一方面多渠道打广告,除在腾讯生态产品中推广外,还在抖音、B 站、知乎等平台进行大量投放。根据 App Growing 数据显示,在 2 月广告投放强度前 20 的 AI 工具中,大厂 AI 产品都有上榜(华为没有 TOC 产品未在其中)。其中花钱最多的是腾讯元宝,今年 2 月,其投放金额占比达到总金额的 46%,几乎赶上过去 9 个月的总和,超过了字节的豆包。另外,阿里也大规模招聘 TO C 业务相关人才。从业者认为,可能是 DeepSeek 的开源 +API 低价给大厂 TO B 业务带来了更大压力,进而促使大厂想在 TO C 上寻找更多商业化出路。

三是 TO C 应用从收费变为免费。DeepSeek 好用且免费,在它大火之后,国内百度的文心一言、国外 OpenAI 即将推出的 GPT-5,都宣布将对用户免费开放。“目的在于拉拢更多用户,提高市场占有率。”覃相表示,更多的用户反馈可以进一步优化模型性能,从而提升 B 端服务能力,收取更高的企业定制模型费。

四是从重投入到降本打价格战。在过去几年的“百模大战”中,国内外 AI 大模型公司投入了几十亿甚至上百亿美元,而 DeepSeek 仅以 557.6 万美元的 GPU 成本,就训练出了与 OpenAI o1 能力相当的 DeepSeekR1 模型,这让大厂开始反思。不止一位从业者表示,大厂降本从去年下半年就已开始,但 DeepSeek 的出现加速了这一趋势。覃相明显感觉到,从去年开始,大模型的竞争已从“技术为先”转向“成本 + 生态”。比如去年 1 月豆包 1.5Pro 发布的 API 价格大幅下降,12 月字节又将视觉模型价格降幅打到 85%,推动行业进入“厘时代”。今年 2 月,两位老百度人还因大模型价格“隔空交战”,百度智能云事业群总裁沈抖在百度智能云事业群组(ACG)全员会上指出,国内大模型行业存在“恶意价格战”并点名豆包,随后字节火山引擎总裁谭待在朋友圈回应,指出降价是技术进步的必然结果。DeepSeek 也未停歇,刚宣布完 API 优惠期结束,2 月 26 日又宣布“限时降价”,每日 00:30-08:30,DeepSeek-V3 降至原价的 50%,DeepSeek-R1 低至 25%,降幅最高达 75%。大厂的压力因此更大了。

免费、开源,大厂能否赢回主场?

综合从业者的观点,在这四大变化中,目前对大厂影响最大的是开源和免费。

先来看开源。大模型领域专家刘聪指出,在 DeepSeek 出现之前,无论国外的 OpenAI,还是国内大厂,要么选择全部闭源,要么选择开源部分大模型(非最好版本),而 DeepSeek 则将其最厉害的推理大模型 DeepSeek-R1 选择开源,这让从业者颇为兴奋。然而,开源也面临一些问题。人工智能博士微凉表示,开 / 闭源代表着间接 / 直接变现两种商业模式和开发思路。国内大厂的典型开源代表是阿里通义千问大模型,通过为厂家做适配进一步促成商业合作,这是基于自身生态做出的选择。但很多大厂起初将大模型定位为技术主导,视其为生产力,比如 OpenAI、百度、华为、科大讯飞,大模型订阅费是重要的收入来源,选择开源必然会影响收益。开源还会面临恶意攻击和社区维护风险。例如,在代码公开的情况下,恶意攻击者可通过分析代码寻找漏洞,进而对使用这些模型的系统进行攻击。后续的社区维护也是个难题。覃相表示,开源需要持续投入资源维护开发者社区(如提供文档、技术支持、版本更新),否则可能导致技术生态分散。他解释,若开发者自行修改代码并衍生出多个分支(如 Linux 的分支 Ubuntu、CentOS),会加大统一技术标准的难度,导致“技术碎片化”。部分从业者直言,即便大厂开源,对他们的吸引力也有限。开源的目的是吸引技术开发者和合作公司,让大家使用其大模型进行技术迭代和应用开发,但微凉博士认为,“目前各家开源有打广告嫌疑。”“开源能看到的是大模型的推理方法和参数权重,但更重要的数据筛选方法和模型训练技巧,各家都没有放开,这也使得普通开发者很难进行技术迭代。”他说道。值得注意的是,开源并不等同于全免费,使用者还需履行大模型提供商的开源协议,其中包含“付费条款”。比如微凉博士会使用阿里通义千问大模型做一些 AI 应用,利用千问将技术跑通后,若想进一步进行企业定制化微调和适配,便需要联系工作人员。他还透露,开源协议也会有公司规模等限制条款,比如员工人数达到一定数量时,就需要付费。

再来看免费带来的影响。大厂采取免费策略的目的是迅速占领 C 端市场,比如一直对用户免费的豆包表现突出。QuestMobile 数据显示,截至 2025 年 2 月 9 日,豆包周日均(以 2 月 3 日 - 2 月 9 日这一周为周期,计算平均每天的活跃用户数)活跃用户数为 1845 万,仅次于 DeepSeek,高于 Kimi、文小言、通义、元宝。不过,免费的实际意义有多大,从业者尚不确定。这既因为用户对 chatbot 这类工具的忠诚度较低,也因为国内用户的付费意识不强。“即便是需要付费的 AI 生成视频工具,国内大部分应用也靠提供免费积分来吸引用户使用。”一位从业者表示,他认为豆包能在一众同类通用型 AI 产品中脱颖而出,除免费外,与字节强大的市场推广也分不开。覃相认为,DeepSeek 的鲶鱼效应促使大厂从技术竞赛转向成本与生态的综合较量,开源、免费策略是应对竞争与生态构建的“双刃剑”,即便这些措施短期内会降低自身收益,大厂也不得不为之。DeepSeek 引发的鲇鱼效应,仍在持续。

正文完
 0