OpenAI宣布开源新模型，引爆开发者社区

326次阅读

共计 1339 个字符，预计需要花费 4 分钟才能阅读完成。

就在最近，OpenAI 的 CEO Sam Altman 对外宣布，未来几个月将推出一款强大的开放权重语言模型，该模型具备推理能力，并期待与开发者共同探索其应用潜力。

Altman 提到，这是自 GPT- 2 以来，OpenAI 首次计划发布开放权重的语言模型。尽管这个想法酝酿已久，但因为优先事项的原因，过去一直没有实施。如今回过头来看，发布这个模型的时机显得尤为重要。

所谓的开放权重，指的是将 AI 模型（特别是神经网络）的训练参数公开，供大众使用、检查或进一步开发。这使得用户能够在这些权重的基础上进行更改，并重新分发修改后的版本。

虽然开放权重并不能完全定义为开源，但它确实是介于完全闭源和完全开源之间的一种折中方式。这一做法是开源理念在 AI 领域的一种延伸和部分实现，类似先前声称开源的 DeepSeek V3/R1 也只是开放了权重。

在发布之前，OpenAI 会积累数据以评估模型，并确保其安全性和可靠性。为了应对模型发布后可能出现的修改情况，团队还将开展额外的测试和优化。这同时也为进一步的开发流程提供了保障。

为了收集反馈，OpenAI 还积极计划举办一系列针对于开发者的活动，展示早期原型并收集意见。首场活动将在几周后于旧金山启动，之后还会在欧洲和亚太地区持续展开。

对这一过程，OpenAI 研究员 Johannes Heidecke 补充说：“安全性将是我们开发开放权重模型的核心环节。在模型的预训练到发布阶段，我们会遵循严格的准备框架，以确保不会发布可能引发严重风险的模型。尽管开放模型面临许多独特挑战，但我们对此充满信心。”

不过，Altman 的评论区已经瞬间变得热闹非凡，许多网友对模型寄予厚望，其中 OpenAI o1 mini 是网友热议的焦点。全球最大的 AI 开源社区 Hugging Face 的 CEO Clément Delangue 也在评论中亮相。

在讨论开源时，自然少不了提及 DeepSeek。R1 和 R2 也频繁见诸评论。话说回来，大家对 Sam Altman 的发布计划其实心知肚明，毕竟早前的 GPT- 5 被暗示可能在“未来几个月”发布，但直到现在仍然没有显现影迹。

Altman 之前曾透露，得益于 GPT-4o 最近增设的多模态图像生成功能，OpenAI 在短短五天内新增了 100 万用户。由于用户数量激增，OpenAI 的 GPU 几乎被“烧毁”，随着模型的开放，未来形势将会更为复杂。

更值得一提的是，Altman 上个月曾与硅谷分析师 Ben Thompson 进行了深入对话，里面也探讨了开源模型及与 DeepSeek 的竞争关系。Altman 表示：“DeepSeek 确实是个很棒的团队，创造了优秀的模型。但他们成功的原因，部分并不是因为模型本身的实力。这让我明白，隐藏某些功能（例如思维链）实际上给了他人传播的机会，这是我们需要警惕的。”

在今天的最新通知中，他再次强调：“我们对开源的讨论已经考虑了很长时间，但由于其它优先事项的影响，这一举措未能如期推出，而现在发布它的时机显得非常重要。”

可以看得出，这位曾罕见承认 OpenAI 策略的问题的 CEO，已经深刻认识到开源的重要性。在接下来的几个月中，像 Llama 4 和 DeepSeek R2 这样的模型都有可能给 OpenAI 的声誉带来重大挑战，而这次的开源宣布或许是 OpenAI 做好准备的一记反击。

正文完