DeepSeek冲击下中国大模型六强的创新应对策略

210次阅读

共计 2050 个字符，预计需要花费 6 分钟才能阅读完成。

近期，DeepSeek 的重磅推出让全球大模型市场掀起波澜，中外企业纷纷调整战略以应对这股新兴力量的冲击。各大科技巨头与新兴创业公司都成为舆论焦点，围绕 DeepSeek 的技术特色和商业前景接受热烈询问。无论是腾讯紧跟步伐在微信上线 AI 搜索功能，还是百度宣布文心一言免费及文心系列模型开源，业界显露出积极拥抱变革的态度。

国外方面，OpenAI 迅速推出轻量级模型 o3-mini 并不断完善思维链条功能，谷歌 DeepMind 发布的 Gemini 2.0 系列也体现了极具竞争力的性能和价格策略。一时间，全球 AI 生态在 DeepSeek 带来的冲击波中快速重整。

在此背景下，国内六家大模型独角兽企业零一万物、百川智能、阶跃星辰、智谱华章、月之暗面和 MiniMax，虽然未公开发表评论，但动作频频，显示它们正在用实际行动回应挑战。

早在 DeepSeek 面世前，零一万物创始人李开复博士已明确放弃追逐超级大模型，转而聚焦参数适中且性能优秀的轻量级模型。

2 月 14 日，零一万物携手苏州高新区，共同成立了聚焦制造、金融、医疗、生物以及政务的产业大模型基地，推动技术从实验室到生产线落地。李开复强调，大模型将成为驱动实体经济的核心引擎，这一举措极大加速了零一万物的商业化进程。

紧随 DeepSeek-R1 问世，百川智能在 1 月 25 日发布首个拥有语言、视觉和搜索三大推理能力的百川 M1-preview 模型。该模型特别强化了医疗循证推理，能够快速精准答复临床科研问题。

以此为基础的“AI 儿科医生”经过内测已在北京儿童医院上线，在复杂病例多学科会诊中提供高度匹配的诊疗建议，展现了结合 AI 与临床应用的前沿成果。

1 月 20 日，阶跃星辰发布轻量级高效的 Step-2-mini 语言模型及文学大师版本，并快速推出语音和视觉模型的升级。1 月 24 日，其旗下应用“跃问”升级 AI 创意板，支持无需编码快速开发和分享应用。值得注意的是，“跃问”已经整合了 DeepSeek-R1 的强大能力。

公司创始人透露，2 月 21 日将举办生态开放日，外界期待看到更为重磅的回应动作。

2 月 11 日，智谱华章联合创始人唐杰在巴黎国际峰会分享了对自主 AI 系统（Agentic LLMs）的前瞻见解，强调到了 2025 年，具备计划制定与复杂任务执行能力的智能体将普遍融入工作和生活。

与此同时，智谱继续深化与三星的合作，将其 Agentic GLM 模型植入最新 Galaxy S25 手机，并悄然携手知名二次元 AI 角色生成应用“捏 ta”，彰显产业链协同能力。

DeepSeek-R1 发布没多久，月之暗面发布了多模态思考模型 Kimi k1.5。该模型拓展了强化学习上下文窗口，采用创新算法实现更灵活、高效的训练与推理，不依赖传统树搜索与价值函数，实现性能突破。

该能力在 OpenAI 最新论文中被提及，显示其在数学和程序推理领域具备显著提升。

1 月 20 日，MiniMax 发布 T2A-01 系列多语言语音模型及其海螺语音产品，支持丰富的情绪与语速调节，实现高度自然的智能语音合成。

早前，CEO 公开表达开源理念重要性，1 月 20 日同步宣布 MiniMax-01 系列模型并即刻开源，结合 Lightning Attention 架构支持 4 千万 token 上下文处理，展示技术领先与开放战略。

事实上，冲击远不止影响六家独角兽，国内各大科技巨头和 AI 产业链上下游都展现了积极开放的姿态。例如腾讯在云计算、大模型应用和微信等多端集成 DeepSeek 技术，为用户提供更优体验，华为、阿里、字节跳动等公司也采取了类似策略。

百度更是宣布文心大模型即将免费开放，并计划于 6 月底开源，体现出拥抱开放创新的态度。李彦宏指出，创新不可预测，关键在于营造激发创新的环境。

DeepSeek 同样在国际市场掀起关注，成为华尔街分析师和科技巨头讨论热点。OpenAI 紧急推出 o3-mini 免费模型，CEO 在公开讨论中反思开源策略，显示行业格局正在重新洗牌。

此外，超过百家第三方机构和平台已接入 DeepSeek 模型，GitHub 上相关项目星标数持续攀升，催生了丰富的 AI 应用生态。

DeepSeek 的出现如同巨鲸激起巨浪，引发了全球大模型领域的激烈竞技。中国六小强用多维策略积极应对，涵盖技术研发、应用落地与产业合作，使 AI 技术更贴近实际需求。

与此同时，产业链上下游广泛协同，推动开放生态建设和创新加速。未来，大模型的竞争将不仅仅体现在规模和速度，更多将集中在产品体验和产业应用的深度融合上，激励整个行业迈向新高度。

正文完

DeepSeek 中国AI企业产业应用人工智能大模型

发表至：科技

2025-09-01

0

趋境科技完成数千万元融资，推动企业智能化进程

宁德时代以技术许可方式布局美国市场，技术外流疑虑与战略考量

元宇宙寒冬来袭：热潮退却与行业困局

33 岁再创业，裴宇欲造手机替代苹果

iPhone新机助力，苹果净利止跌回升

DeepSeek冲击下中国大模型六强的创新应对策略

DeepSeek 引发全球人工智能市场的强烈震荡

中国六大大模型独角兽“六小强”的沉稳行动

零一万物：轻量化模型与产业深度融合

百川智能：多模态全场景推理与医疗精准服务

阶跃星辰：多模态模型接连推出，稳抓创新节奏

智谱华章：打造具备自主 Agent 能力的系统级大模型

月之暗面：推出长上下文、多模态强化学习创新模型

MiniMax：语音模型与开源战略齐头并进

深度冲击催生行业新生态，科技巨头纷纷响应

国际视野中 DeepSeek 引发的行业效应

总结：巨鲸下的百川竞流，AI 生态加速繁荣

B站商业模式困境：UP主停更潮背后的故事

阿里限价看涨回购：如何聪明融资与防稀释

Meta「分割一切」模型新突破：检测、分割、生成三合一

激光雷达玩家盈利曙光初现？成本下降与技术竞争的双重博弈

英伟达：人工智能算力垄断的全球新帝国

马斯克：以商业之力重塑美国航天格局

阿里云全面接入通义千问，张勇展望大模型未来

COMPUTEX 2024: AI驱动掀起PC硬件创新浪潮

AI浪潮下，“美图秀秀们”何去何从？

Apple TV+携手中国移动布局中国市场，流媒体竞争格局再添变数

成年人为何更易陷入AI成瘾？原因揭秘

徕卡、蔡司、哈苏联名手机大战，谁真正实力派？

长盛轴承：掀起人形机器人产业的8倍涨势

张一鸣的TikTok国际化战略揭秘

人人视频为何深陷版权大战？揭秘其生存之道