Mistral Medium 3 推出:性能与性价比的较量

22次阅读

共计 1014 个字符,预计需要花费 3 分钟才能阅读完成。

当地时间 5 月 7 日,法国 AI 初创公司 Mistral AI 宣布推出新模型 Mistral Medium 3。这款模型有三大亮点:一是开创了新的模型类别,兼具顶级性能和大幅降低成本,同时简化了部署方式,助力企业更快应用;二是编程和多模态理解能力出色;三是提供了包括混合部署、本地或虚拟私有云部署等企业级功能。

根据官方数据,在多项基准测试中,Mistral Medium 3 的表现达到了 Claude Sonnet 3.7 的 90%,但成本却显著降低(每百万 token 输入 0.4 美元,输出 2 美元)。无论是 API 使用还是自部署系统,其定价都优于 DeepSeek V3 等模型。官方强调,Mistral Medium 3 在编程和 STEM 任务中的表现尤为突出,与那些参数更大但速度较慢的对手相比毫不逊色。

此外,Mistral Medium 3 支持在任意云平台上部署,包括配置四块及以上 GPU 的自托管环境。不过,也有一些网友对 Mistral Medium 3 提出了不同看法,认为其在写小说方面表现不佳,编程能力虽好但并非顶尖。

失去开源口碑是 Mistral 面临的另一挑战。2023 年 9 月,开源的 Mistral 7B 凭借卓越性能和开放的 Apache 2.0 许可证引发了社区热议。然而,自那时起,Mistral 再未推出让人印象深刻的开源模型。尤其是其广受欢迎的新编程工具,目前仅限商业平台销售,且已与微软、亚马逊和谷歌达成云分销合作。这让不少网友呼吁 Mistral 尽快推出下一个开源模型。

一位网友评论道:‘如果 Mistral 能推出一款开源权重模型,质量达到 GPT-4.1 mini 的水平,但规模与当前的 Mistral Small 相当,那该多好啊。’另一位网友则讽刺道:‘他们之前承诺开放,结果却发布了更多受限的“开放权重”模型,这种做法实在令人失望。’

随着 AI 领域的快速发展,Mistral 在追赶更大规模竞争对手的过程中遇到了困难,这与其早期的成本效率策略有关。Mistral 的三位创始人均曾在 Google DeepMind 或 Meta 工作,他们以高效的算力利用闻名。这一策略帮助 Mistral 赢得了包括微软在内的支持者,但同时也面临来自 DeepSeek 等新兴公司的激烈竞争。

尽管如此,Mistral 依然被视为欧洲在生成式 AI 领域的希望。法国总统马克龙对其独立性表示赞赏,并鼓励欧盟避免过度监管。然而,Mistral 目前的处境并不乐观,员工人数仅为 150 人左右,而其美国竞争对手往往拥有数千名员工。

正文完
 0