共计 525 个字符,预计需要花费 2 分钟才能阅读完成。
5 月 7 日消息,美国当地时间周二,谷歌 DeepMind 发布 Gemini 2.5 Pro“I/O”,是 3 月发布的多模态大语言模型的升级版本。从初步基准测试结果看,谷歌首次在关键代码生成评估指标上全面领先。
新版本编号为“gemini-2.5-pro-preview-05-06”,已向部分用户开放,还为 Gemini 移动应用中的功能提供支持。它能用于多种开发场景,比如自动匹配视觉风格,支持高效开发工作流。
作为专有模型,企业用户需通过谷歌云服务平台付费使用,价格未调整。相比 Anthropic 的 Claude 3.7 Sonnet,Gemini 2.5 Pro 价格更有优势。
此次更新重点提升了函数调用的准确率与触发可靠性。一大亮点是只需一条提示就能构建完整、可交互的网页应用或模拟程序,降低了入门门槛。
在第三方平台 WebDev Arena 的排行榜中,Gemini 2.5 Pro Preview(05-06)在生成美观且实用的网页应用方面获得人类评审最高分,超越 Anthropic 的 Claude 3.7 Sonnet。
多个知名开发者与平台负责人对 Gemini 2.5 Pro Preview(05-06)在实际生产环境中的表现给予高度评价,其在多个维度展现出实用性提升,预示将获更广泛采纳。
正文完