共计 1073 个字符,预计需要花费 3 分钟才能阅读完成。
Mistral AI 刚发布了多模态新模型 Mistral Medium 3,主打编程和多模态理解,在性能和成本间做了平衡。
官方称,在各类基准测试中,Mistral Medium 3 性能达到或超越 Claude Sonnet 3.7 的 90%,成本却大大降低。Claude 3.7 Sonnet 每百万输入 token 要 3 美元,每百万输出 token 15 美元,而 Mistral Medium 3 每百万输入 token 只要 0.4 美元,每百万输出 token 2 美元。
整体性能上,Mistral Medium 3 和领先开源模型 Llama 4 Maverick 以及企业级模型 Cohere Command A 相比,都不落下风。
目前,Mistral Medium 3 API 已在 Mistral La Plateforme 和 Amazon Sagemaker 上线,不久后还会在其他平台推出。
Mistral Medium 3 在编程和 STEM 任务中表现突出,官方说它性能接近那些大且运行慢的竞争对手。不过,它既不开放模型权重,也没透露模型大小。
Mistral AI 还发布了第三方人类评估,在编程方面,Mistral Medium 3 依旧占优势。在多模态和其他人语言任务中,和 Llama 4 Maverick 相比,Mistral Medium 3 表现也更好。
官方特别强调了 Mistral Medium 3 适应企业环境的能力,包括混合部署、本地或虚拟私有云内部署、定制化后期训练以及和企业工具及系统集成等。企业能轻松把智能集成到系统中,借助其应用 AI 解决方案,该模型可持续预训练、全面微调,并融入企业知识库,成为针对特定领域训练、持续学习和自适应工作流程的高保真解决方案。
官方称,金融服务、能源和医疗保健领域的客户正在用该模型测试,通过深入背景信息来丰富客户服务、实现业务流程个性化,并分析复杂数据集。
此外,他们还推出了 Le Chat Enterprise,这是一项面向企业的聊天机器人服务,提供了 AI Agent 建造器等工具,还将 Mistral 的模型与第三方服务集成。
Mistral Medium 3 发布后引发很多网友关注,有人为其“高性价比”点赞,也有人吐槽模型没开源却高调与开源模型比较。还有网友自己去比较。StabilityAI 创始人翻出 Gemini 2.5 Flash 的基准测试结果后表示,与 Gemini 2.5 Flash 竞争很难,它成本比 Mistral Medium 3 低 70%。大家期待开源模型发布,这是 Mistral 的关键优势。
继三月份推出 Mistral Small、今日推出 Mistral Medium 后,Mistral AI 透露接下来几周正着手开发“大型”项目。