大厂AI焦虑：DeepSeek冲击下的变革与挑战

122次阅读

共计 4322 个字符，预计需要花费 11 分钟才能阅读完成。

在 DeepSeek 出现之前，大厂在 AI 领域的发展路线是高举高打、重投入，围绕自身优势打造产品。大模型作为 AI 行业的基础设施，受到众多企业的关注。互联网大厂如百度、腾讯、阿里、字节、快手等，消费电子厂商以华为为代表，智能语音厂商像科大讯飞等，纷纷推出了自研大模型。相较于“AI 六小虎”这类初创公司，大厂具备更雄厚的资金和人才储备。

从 AI 行业整体技术迭代速度以及各家公开信息来看，大厂大模型在底层技术上并无根本性差别，但在入场时间、模型定位、市场策略方面存在差异。

首先是入场时间。大模型发布时间的早晚，在一定程度上反映了大厂在相关技术领域的布局和积累情况。华为发布大模型的时间较早，不过其底层虽基于 Transformer 架构，但与 ChatGPT 式对话不同，属于 AI 大模型在“产业专用”方向，而 ChatGPT 式为通用智能。若聚焦通用智能大模型，百度行动较早，在 2023 年 3 月便启动了文心一言大模型的邀测（非全面开放）。然而，推出时间早晚并非衡量模型优劣的核心要素。

大厂的业务布局决定了大模型的应用方向，进而形成了不同的模型定位。从技术角度分析，这源于各家的训练数据。百度文心一言主要依靠互联网文本数据；阿里通义千问涵盖文本、图片、音频等多模态数据；腾讯混元基于社交网络和用户行为数据；字节豆包约 50%-60% 来自字节的自有业务（抖音、今日头条）数据；华为盘古大模型则运用了包含工业、气象、文图、图像在内的各类数据。这使得各家大模型的优势场景各异。例如，文心一言在长文本处理和多语种对话方面表现出色；混元在社交场景更具优势；豆包在生成内容和精准推荐上较为领先；通义千问在电商推荐场景响应更快；盘古执行速度和泛化能力出色，能高效应对大规模任务。可以看出，各家大模型的优势领域都与自身核心业务相关。

最后是市场策略，这在一定程度上体现了大厂对自身能力和行业趋势的判断。外界大致可以从开闭源以及 TO C 产品是否免费这两个方面进行观察。字节、快手、讯飞、华为目前坚持闭源，百度、腾讯、阿里则选择大部分开源。在 TO C 应用方面，百度、腾讯、阿里采取免费路线，字节、快手、讯飞多为用户提供有限次数的免费额度。阿里通过开源尝到了甜头，开源 AI 平台 Hugging Face 发布的最新开源大模型榜单显示，排名前十的开源大模型全部是基于阿里通义千问的衍生模型。在 TO C 产品中，坚持免费的豆包发展势头迅猛。根据 AI 产品榜显示，2025 年 1 月，豆包在国内千万月活俱乐部中排名第一，达到 7861 万，远超其他大厂应用。

不过，大家对大厂大模型整体能力的排名更为好奇。据多位从业者分析，目前大厂的顶级大模型多为闭源，在信息不完全透明的情况下，判断各家能力并非易事。弗若斯特沙利文在《2024 年中国大模型能力评测》报告中指出，百度文心一言、腾讯混元、阿里通义千问等大厂大模型都处于第一梯队，认为它们在技术能力上较为全面，用户量也相对较大。但对于哪家整体能力更为出色，报告并未给出明确判断。AI 软件工程师覃相表示，各家在技术架构和训练数据等方面存在差异。从技术架构来看，模型规模和参数量是衡量大模型复杂程度和能力的重要指标。一般而言，规模越大、参数越多，模型的学习能力和表达能力就越强。例如，DeepSeek-R1 被称作参数上的巨无霸，高达 6710 亿的参数构建了一个庞大的知识储备库。他还表示，从这一维度判断，在大厂的大模型中，具有深度推理能力的大模型，如文心一言在一众大厂中能力较强。但如果看垂直领域的能力，文心一言则比不上通义千问，毕竟后者开发并上线了基于自身的 8 个垂直领域模型。总之，各家大模型都有其优势，很难有一家在各个维度上都超越其他家。

DeepSeek 的出现，促使大厂重新审视自身的 AI 战略布局。结合各家最新动态以及从业者的观点，具体有以下四大转变。

一是从闭源到开源，这是最为重大的转变。不止一位从业者指出，DeepSeek 的火爆与开源密切相关。此前，国内外对大模型开闭源的讨论从未停止，百度董事长李彦宏曾是闭源的坚定支持者，认为无论在保持技术领先性还是商业模式方面，闭源都优于开源。覃相从技术角度分析，开源意味着核心代码公开，竞争对手能够快速复现技术路径，大厂早期选择闭源主要是为了保护知识产权和商业壁垒（如 OpenAI 早期未开源 GPT-3）。但他发现，在 DeepSeek 的带动下，大厂已转变方向，更倾向于通过生态绑定（如腾讯混元开源视频模型，吸引开发者使用其云服务）实现长期收益，而非单纯依赖技术保密。如今，百度已宣布文心大模型 4.5 系列将于 2025 年 6 月底全面开源。截至目前，百度、阿里、腾讯的大部分模型都已开源或者宣布开源。

二是业务重点从 TO B 转向“双线并行”。覃相解释，大模型变现主要有增值服务、数据变现、合规服务三种方式，其中增值服务占比最大，依靠企业级定制与 API 调用收入。他透露，百度文心一言企业版年费超千万元，阿里云通义千问为政企客户提供定制化客服系统，单项目合同额可达数亿元。也就是说，大厂当前盈利仍主要依赖 B 端，但近期很多大厂开始重视 TO C 应用的推广，改为 TO B、TO C“双线并行”。例如腾讯加大对元宝的宣传，一方面将其接入微信九宫格，获得强流量入口，另一方面多渠道打广告，除在腾讯生态产品中推广外，还在抖音、B 站、知乎等平台进行大量投放。根据 App Growing 数据显示，在 2 月广告投放强度前 20 的 AI 工具中，大厂 AI 产品都有上榜（华为没有 TOC 产品未在其中）。其中花钱最多的是腾讯元宝，今年 2 月，其投放金额占比达到总金额的 46%，几乎赶上过去 9 个月的总和，超过了字节的豆包。另外，阿里也大规模招聘 TO C 业务相关人才。从业者认为，可能是 DeepSeek 的开源 +API 低价给大厂 TO B 业务带来了更大压力，进而促使大厂想在 TO C 上寻找更多商业化出路。

三是 TO C 应用从收费变为免费。DeepSeek 好用且免费，在它大火之后，国内百度的文心一言、国外 OpenAI 即将推出的 GPT-5，都宣布将对用户免费开放。“目的在于拉拢更多用户，提高市场占有率。”覃相表示，更多的用户反馈可以进一步优化模型性能，从而提升 B 端服务能力，收取更高的企业定制模型费。

四是从重投入到降本打价格战。在过去几年的“百模大战”中，国内外 AI 大模型公司投入了几十亿甚至上百亿美元，而 DeepSeek 仅以 557.6 万美元的 GPU 成本，就训练出了与 OpenAI o1 能力相当的 DeepSeekR1 模型，这让大厂开始反思。不止一位从业者表示，大厂降本从去年下半年就已开始，但 DeepSeek 的出现加速了这一趋势。覃相明显感觉到，从去年开始，大模型的竞争已从“技术为先”转向“成本 + 生态”。比如去年 1 月豆包 1.5Pro 发布的 API 价格大幅下降，12 月字节又将视觉模型价格降幅打到 85%，推动行业进入“厘时代”。今年 2 月，两位老百度人还因大模型价格“隔空交战”，百度智能云事业群总裁沈抖在百度智能云事业群组（ACG）全员会上指出，国内大模型行业存在“恶意价格战”并点名豆包，随后字节火山引擎总裁谭待在朋友圈回应，指出降价是技术进步的必然结果。DeepSeek 也未停歇，刚宣布完 API 优惠期结束，2 月 26 日又宣布“限时降价”，每日 00:30-08:30，DeepSeek-V3 降至原价的 50%，DeepSeek-R1 低至 25%，降幅最高达 75%。大厂的压力因此更大了。

综合从业者的观点，在这四大变化中，目前对大厂影响最大的是开源和免费。

先来看开源。大模型领域专家刘聪指出，在 DeepSeek 出现之前，无论国外的 OpenAI，还是国内大厂，要么选择全部闭源，要么选择开源部分大模型（非最好版本），而 DeepSeek 则将其最厉害的推理大模型 DeepSeek-R1 选择开源，这让从业者颇为兴奋。然而，开源也面临一些问题。人工智能博士微凉表示，开 / 闭源代表着间接 / 直接变现两种商业模式和开发思路。国内大厂的典型开源代表是阿里通义千问大模型，通过为厂家做适配进一步促成商业合作，这是基于自身生态做出的选择。但很多大厂起初将大模型定位为技术主导，视其为生产力，比如 OpenAI、百度、华为、科大讯飞，大模型订阅费是重要的收入来源，选择开源必然会影响收益。开源还会面临恶意攻击和社区维护风险。例如，在代码公开的情况下，恶意攻击者可通过分析代码寻找漏洞，进而对使用这些模型的系统进行攻击。后续的社区维护也是个难题。覃相表示，开源需要持续投入资源维护开发者社区（如提供文档、技术支持、版本更新），否则可能导致技术生态分散。他解释，若开发者自行修改代码并衍生出多个分支（如 Linux 的分支 Ubuntu、CentOS），会加大统一技术标准的难度，导致“技术碎片化”。部分从业者直言，即便大厂开源，对他们的吸引力也有限。开源的目的是吸引技术开发者和合作公司，让大家使用其大模型进行技术迭代和应用开发，但微凉博士认为，“目前各家开源有打广告嫌疑。”“开源能看到的是大模型的推理方法和参数权重，但更重要的数据筛选方法和模型训练技巧，各家都没有放开，这也使得普通开发者很难进行技术迭代。”他说道。值得注意的是，开源并不等同于全免费，使用者还需履行大模型提供商的开源协议，其中包含“付费条款”。比如微凉博士会使用阿里通义千问大模型做一些 AI 应用，利用千问将技术跑通后，若想进一步进行企业定制化微调和适配，便需要联系工作人员。他还透露，开源协议也会有公司规模等限制条款，比如员工人数达到一定数量时，就需要付费。

再来看免费带来的影响。大厂采取免费策略的目的是迅速占领 C 端市场，比如一直对用户免费的豆包表现突出。QuestMobile 数据显示，截至 2025 年 2 月 9 日，豆包周日均（以 2 月 3 日 - 2 月 9 日这一周为周期，计算平均每天的活跃用户数）活跃用户数为 1845 万，仅次于 DeepSeek，高于 Kimi、文小言、通义、元宝。不过，免费的实际意义有多大，从业者尚不确定。这既因为用户对 chatbot 这类工具的忠诚度较低，也因为国内用户的付费意识不强。“即便是需要付费的 AI 生成视频工具，国内大部分应用也靠提供免费积分来吸引用户使用。”一位从业者表示，他认为豆包能在一众同类通用型 AI 产品中脱颖而出，除免费外，与字节强大的市场推广也分不开。覃相认为，DeepSeek 的鲶鱼效应促使大厂从技术竞赛转向成本与生态的综合较量，开源、免费策略是应对竞争与生态构建的“双刃剑”，即便这些措施短期内会降低自身收益，大厂也不得不为之。DeepSeek 引发的鲇鱼效应，仍在持续。

正文完