OpenAI宣布开源新模型,引爆开发者社区

4次阅读

共计 1339 个字符,预计需要花费 4 分钟才能阅读完成。

就在最近,OpenAI 的 CEO Sam Altman 对外宣布,未来几个月将推出一款强大的开放权重语言模型,该模型具备推理能力,并期待与开发者共同探索其应用潜力。

Altman 提到,这是自 GPT- 2 以来,OpenAI 首次计划发布开放权重的语言模型。尽管这个想法酝酿已久,但因为优先事项的原因,过去一直没有实施。如今回过头来看,发布这个模型的时机显得尤为重要。

所谓的开放权重,指的是将 AI 模型(特别是神经网络)的训练参数公开,供大众使用、检查或进一步开发。这使得用户能够在这些权重的基础上进行更改,并重新分发修改后的版本。

虽然开放权重并不能完全定义为开源,但它确实是介于完全闭源和完全开源之间的一种折中方式。这一做法是开源理念在 AI 领域的一种延伸和部分实现,类似先前声称开源的 DeepSeek V3/R1 也只是开放了权重。

在发布之前,OpenAI 会积累数据以评估模型,并确保其安全性和可靠性。为了应对模型发布后可能出现的修改情况,团队还将开展额外的测试和优化。这同时也为进一步的开发流程提供了保障。

为了收集反馈,OpenAI 还积极计划举办一系列针对于开发者的活动,展示早期原型并收集意见。首场活动将在几周后于旧金山启动,之后还会在欧洲和亚太地区持续展开。

对这一过程,OpenAI 研究员 Johannes Heidecke 补充说:“安全性将是我们开发开放权重模型的核心环节。在模型的预训练到发布阶段,我们会遵循严格的准备框架,以确保不会发布可能引发严重风险的模型。尽管开放模型面临许多独特挑战,但我们对此充满信心。”

不过,Altman 的评论区已经瞬间变得热闹非凡,许多网友对模型寄予厚望,其中 OpenAI o1 mini 是网友热议的焦点。全球最大的 AI 开源社区 Hugging Face 的 CEO Clément Delangue 也在评论中亮相。

在讨论开源时,自然少不了提及 DeepSeek。R1 和 R2 也频繁见诸评论。话说回来,大家对 Sam Altman 的发布计划其实心知肚明,毕竟早前的 GPT- 5 被暗示可能在“未来几个月”发布,但直到现在仍然没有显现影迹。

Altman 之前曾透露,得益于 GPT-4o 最近增设的多模态图像生成功能,OpenAI 在短短五天内新增了 100 万用户。由于用户数量激增,OpenAI 的 GPU 几乎被“烧毁”,随着模型的开放,未来形势将会更为复杂。

更值得一提的是,Altman 上个月曾与硅谷分析师 Ben Thompson 进行了深入对话,里面也探讨了开源模型及与 DeepSeek 的竞争关系。Altman 表示:“DeepSeek 确实是个很棒的团队,创造了优秀的模型。但他们成功的原因,部分并不是因为模型本身的实力。这让我明白,隐藏某些功能(例如思维链)实际上给了他人传播的机会,这是我们需要警惕的。”

在今天的最新通知中,他再次强调:“我们对开源的讨论已经考虑了很长时间,但由于其它优先事项的影响,这一举措未能如期推出,而现在发布它的时机显得非常重要。”

可以看得出,这位曾罕见承认 OpenAI 策略的问题的 CEO,已经深刻认识到开源的重要性。在接下来的几个月中,像 Llama 4 和 DeepSeek R2 这样的模型都有可能给 OpenAI 的声誉带来重大挑战,而这次的开源宣布或许是 OpenAI 做好准备的一记反击。

正文完
 0