共计 2476 个字符,预计需要花费 7 分钟才能阅读完成。
1. OpenAI 引爆推理 AI 竞赛
今年 12 月,OpenAI 先后发布 o1 和 o3 系列模型,引发了一场大规模的推理竞赛。根据 OpenAI 公布的测试数据,o3 在数学、编程和博士级科学问题上展现出强大实力。比如,它在全球数学家团队设计的 EpochAI Frontier Math 测试中,准确率高达 25.2%,远超其他模型的 2.0% 以下。国内外多家科技公司争相追赶,如谷歌的 Gemini 2.0 Flash Thinking,月之暗面 Kimi 的 k0-math 数学推理模型,DeepSeek 的 DeepSeek-R1-Lite 预览版,以及阿里云的 QwQ-32B-Preview 等,都在一些评测中超过了 o1。
不过,目前 o3 更适合专业领域的使用,如编程、数学和科学研究,却不一定能直接改善普通用户体验。此外,推理成本依然高昂。如 ARC-AGI 基准测试显示,虽然 o3 高计算模式下得分率达 87.5%,但单任务费用高达几美元。幸运的是,清华 NLP 团队提出的大模型密度定律表明,未来每 100 天,能用更小的模型实现相同性能,推理成本将快速下降。
总的来看,OpenAI 重申了规模规律(Scaling Law)依然有效,重点从预训练转向推理提升,通过强化学习和增多思考时间实现更强的复杂推理能力,这对全球模型厂商来说提出了新的追赶目标。
2. 降价持续,视频模型也卷进战局
继年初和 9 月的两轮价格大战后,12 月 OpenAI 和火山引擎(字节跳动旗下云厂商)再掀第三轮降价热潮。OpenAI 针对 GPT-4o 音频模型进行了 60% 的价格调降,输入费用降至 40 美元 / 百万 tokens,输出 80 美元 / 百万 tokens。更小的 GPT-4o mini 音频价格仅为 4o 的四分之一,明显回应了开发者成本压力。
火山引擎则将价格战扩展到了视频模型领域,其发布的豆包视觉理解模型推理输入价格低至 0.003 元 / 千 tokens,较行业均价便宜 85%,开启了“厘时代”。此前 5 月火山引擎启动的豆包主力模型推理价格战已带动阿里云、百度、腾讯云等跟进,今年大模型推理算力成本整体下降超 90%。
国内降价幅度更大,多由云厂商主导。主要原因包括:通过低价换取更大推理算力使用量,激发开发者和企业积极接入,从而抢占应用生态;其次是技术优化带来的成本降低,结合算法改进、混合硬件利用等工程手段,实现更高效算力使用。以火山引擎为例,日均 tokens 从今年 5 月的 1200 亿激增至 12 月超 4 万亿,涨幅达 33 倍;百度文心模型使用量也增长 6.8 倍。
著名投资人李开复总结道,短短一年半内,模型价格下降了 500 倍,能力大幅提升,未来几年内成本将进一步降低以支撑多样化应用。
3. 大模型应用加速落地,但距离“好用”仍有距离
推理成本降低和基础模型多样化,催生了大模型应用层的爆发。风险投资人指出,初创企业不再仅仅围绕单一模型做表层包装,而是通过“鸡尾酒策略”融合多模型优势以优化性能和成本。
国内 AI 厂商如跃然创新便同时与 MiniMax、豆包和智谱合作,满足儿童教育等细分场景的需求。行业共识认为,AI 对话产品或许只是一阶段过渡,AI Agent 和 AI 搜索将成为未来竞争的核心。12 月,OpenAI 宣布为 ChatGPT 新增搜索功能,谷歌也计划在 Chrome 中加入“AI 模式”,而 Perplexity AI 获得 5 亿美元融资,估值达到 90 亿美元,表明搜索领域竞争日益激烈。
同时,AI Agent(智能代理)成为最受关注的应用方向。Anthropic 的 Computer Use 功能、智谱的 AutoGLM 均展示了 Agent 在端侧的交互性和自动化能力。多家科技巨头正打造 Agent 平台,试图将它们嵌入人们的工作生活中,例如预订酒店、点餐甚至成为工作助理。智谱 AI CEO 形象地称其为通用操作系统 LLM-OS 的雏形,寄望通过 Agent 建立生态圈,实现多设备互联互通。
不过理想与现实仍存在差距,目前 Agent 尚未形成成熟的商业模式,特别是在 C 端仍依赖于现有流量红利,B 端则面临收集领域数据和编码特定认知架构的技术壁垒。除此之外,AI 玩具和 AI 耳机等新兴产品也在试水市场,销量和用户复购将决定这些领域的实际潜力。
4. 资金分化明显,融资热逐渐分层
年末大模型领域融资热潮再起。多个国内外知名 AI 企业获得新一轮资金支持,使得国内基础模型企业估值突破 200 亿元。值得注意的是,融资主体主要是老股东、国资和大型科技公司,表明资本对头部企业信心充足。
在国际市场,Perplexity AI、X.AI、Databricks 和 Cursor 等均完成新融资,其中 X.AI 计划购入 10 万块 NVIDIA GPU 扩大算力规模。风险机构警告,头部公司将继续争得高估值,而多数企业需展现明确业绩才能获投,导致“富人”和“穷人”分化加剧。市场整合加速,一些初创公司寻求退出或被收购,如 Perplexity 收购 Carbon,Anysphere 旗下 Cursor 获得 Supermaven AI 助手。
业内判断,未来一段时间,大模型领域将呈现两极分化:头部玩家扩张并整合资源,中小公司承压甚至倒闭,这促进行业加速成熟。
5. 人才流动频繁,行业迎来新一轮洗牌
“人、钱、事”是公司的生命线,其中人才正成为大模型行业最大的挑战。年末围绕人才流动和组织调整的话题频频出现。
大模型领域“六小龙”中已有不少重点成员离职,他们有的选择回归大公司,有的展开新一轮创业,多从事 AI 相关项目。例如潘欣加入闪极 AI 投身 AI 眼镜项目,前月之暗面负责人王冠创立的新公司 ONE2X 完成融资。OpenAI 也经历了关键技术骨干的离开,包括 GPT 之父 Alec Radford 和搜索负责人 Shivakumar Venkataraman。
大型企业内部亦加强调整,如阿里云旗下“通义”大模型独立并并入阿里智能信息事业群,以适应激烈竞争环境。
可以肯定的是,随着行业竞争加剧,人才整合和分化将持续。回顾去年 12 月,OpenAI 经历管理层重大变动,如今则完成了新一轮人才换血。在过去的一年里,技术和市场快速演进,AI 已逐渐深入人们生活,正如 OpenAI CEO Sam Altman 所言:“你只管去做事情。”