寡头化的硅谷公司:想让DeepSeek成为下一个TikTok

6次阅读

共计 2640 个字符,预计需要花费 7 分钟才能阅读完成。

DeepSeek 引发的连锁反应

DeepSeek 在引发美国主流科技公司的集体恐慌后,其待遇迅速逼近 TikTok。DeepSeek V3 和 R1 连续发布后,被美国市场认为找到了比“OpenAI- 英伟达 -stargate”烧钱模式更高效的新方法,进而被快速加上“中美竞争中国突破美国封锁”的滤镜,成为众人关注焦点,英伟达等美股最坚挺的科技股一度出现“股灾”式下跌。

OpenAI 在 DeepSeek 影响下被迫快速调整 o 系列模型收费策略,公开做出回应。Sam Altman 先是揶揄“抄袭更容易创新更难”,后又承认 DeepSeek 是重要对手,而 OpenAI 首席研究员 Mark Chan 则称 DeepSeek 是“独立发现了 o1 的技术方法”。与此同时,多家媒体报道 OpenAI 和微软已对 DeepSeek 展开调查,认为其蒸馏了 OpenAI 模型的数据,此前 OpenAI 也曾对字节做过类似调查,导致字节在发布豆包 1.5 时特意强调未蒸馏任何数据。

美国官方相关部门借此展开更多讨论,不少政策制定者和研究员认为出口管制“没起到什么作用”,一些官方机构开始禁止 DeepSeek 的使用,同时 DeepSeek 记录到大量来自美国 IP 地址的攻击,OpenAI 的“蒸馏”指责有演变成“知识产权盗窃”的趋势,调查和封禁风声不断。期间,做着大量美国政府生意的公司 CEO 也有所表态,Scale.ai 的 Alexander Wang 称“DeepSeek 有 5 万台 H100”,成为讨论出口管制政策的依据。

然而,OpenAI 的一系列动作在开发者社区引起一边倒的反感。“你的论文呢?”“你倒是开源啊?”“你没有发布的成果,别人做出来你来恭喜别人?真高贵。”HuggingFace 的 CEO Clem Delangue 委婉表示,既然 R1 已让 OpenAI 没了竞争危险,要不开源 o1 或写详细论文。另一个获数万阅读的评论也代表了开发者态度:“哥们,交付你们的东西吧别再发推了,受够了。”同时,几款体现开发者喜好的产品“身体很诚实”,Perplexity 把 R1 纳入模型产品,微软的 Azure 开始提供 R1 模型,AMD 的芯片也快速引入针对 R1 的部署服务。

Anthropic CEO 的万字文章

就在这个关口,Anthropic 的 CEO Dario Amodei 发布了一篇颇有火上浇油效果的万字文章。他的目的一是表达自己并未落后,若 DeepSeek 成为 OpenAI 最大敌人,Anthropic 这个第二就更没人在意了,且某种程度上,OpenAI 有了中国对手似乎能解决被 Anthropic 纠缠的价值观和安全问题;二是借 DeepSeek 带来的恐慌,呼吁美国继续加强已有的出口管制。

Dario 称,形容 DeepSeek 的成功更准确的描述是:DeepSeek 造出了接近美国 7 到 10 个月前老模型水平的模型,成本有明显下降但远没人们说的那么夸张。他认为 DeepSeek 的成功是因为在出口管制前,各种英伟达芯片被卖到中国,DeepSeek 和美国公司一样优秀的人才利用这些禁令前的资源取得了今天的成绩,出口管制不是逼出 DeepSeek 成功的原因,反而 DeepSeek 也依赖芯片。所以,出口管制绝对正确,继续实行能让中国只剩人才而无必要芯片,最终美国获胜,实现单极世界,AI 会加强美国在单极世界里的霸权。这不是 Dario 第一次这样表态,在达沃斯论坛他也不停接受采访表达同样观点,这篇万字长文开头他还骄傲提到自己最近鼓吹出口管制的文章《特朗普会让美国维持 AI 的领先》。

寡头化的硅谷公司

这一万字背后,是美国公司正在快速发生的寡头化趋势。Anthropic 这样年轻但在此次 AI 浪潮里快速成为既得利益的公司,习惯于这样行事:认为 DeepSeek 的成功要靠美国继续通过制造和维持资源不平等带来的 AI 霸权来遏制,而非思考自身技术创新和产品市场竞争策略的调整。这让 DeepSeek 更像创新文化代表,而硅谷年轻公司却走向反面。

OpenAI 从来不是硅谷过去代表的草根创业故事,而是含着金钥匙,由最有权势的几个人共同制造的利益共同体。它以 AGI 伟大目标团结不同心思,最终在技术有突破时因利益分崩离析,连非营利组织的外套也直接扔掉。

在对 DeepSeek 的各路讨论中,DeepSeek 自己表述不多但信息量足,它满足了所有人不同想象,变得面目全非任人打扮,但也有自己真正样子。它是一个想尽办法制造适合 AI 技术创新氛围的新型组织,其竞争策略是为研究员提供优渥环境,利于他们保持好奇心做研究,推动 AI 进步。

与此同时,沿袭着 OpenAI 诞生所代表的“资源整合”型路线,硅谷的公司们进入新阶段,1 月 20 日站在国会山的巨头 CEO 们,多年来首次堂而皇之追求寡头垄断地位,靠技术靠愿景获得经济优势的路线被更粗暴的旧时代路线替代,对 GPU 的粗暴追逐和基于它的算力霸权成为创造溢价收益的新方法。

两种模式的差异与未来竞争格局

两种模式对比,真正提供活力的开发者和创业者们对 DeepSeek 好感继续增加。再说回 Anthropic 的发声,就更令人失望了。此前对 DeepSeek 技术分析时提到,R1 Zero 和 R1 的设计将人类对齐这个对模型安全关键的训练阶段拆开,放到两个模型里分别完成,虽带来智能提升,但也给安全问题带来新挑战。按照 OpenAI 和 Anthropic 的待遇,本应出现围绕 R1 系列模型展开的各种安全研究,中国背景研究团队此前对 OpenAI 和 Anthropic 每一代模型都有突出贡献,这些研究帮助闭源模型更好改进。DeepSeek 技术报告更透明,其训练方法中可能因过于追求智能而放弃与人类对齐的部分该如何对待,本是技术社区重要议题,但人们没看到 Anthropic 与 DeepSeek 在这方面讨论交流,等来的是一篇逻辑不严密的万字檄文。

DeepSeek 和 Anthropic 们各自代表的两种模式已成为竞争现实。接下来会如何演进?也许从 DeepSeek 技术创新真正的成功中能找到启示:在 DeepSeek 模型里,系统级优化带来整体智能和效率进步是根源,深入到英伟达芯片和 CUDA 最底层部件的创新是追求整体技术进步理所当然的一部分。但对于硅谷大公司,当不再追求开放竞争,而是习惯性寻求不对等资源优势,算力就不再是优化关键环节,而是变成可堆砌的人为造就的不对等竞争壁垒,一切变得简单,只需要把对手变成下一个 TikTok 就可结束竞争。正是这种对技术创新态度的差异让 R1 和 V3 这样的高效率模型诞生在 DeepSeek,而这些对待技术的态度不同,最终会决定更大的竞争格局。

正文完
 0