谷歌Gemini 2.5 Pro I/O版强势登场，全面碾压Claude 3.7

共计 791 个字符，预计需要花费 2 分钟才能阅读完成。

北京时间 5 月 6 日晚，谷歌 DeepMind AI 研究部门正式推出了 Gemini 2.5 Pro 的升级版本“I/O”特别版。这一版本旨在回应开发者对实际编程和界面设计效能的需求，为用户提供更强大的编程能力。

在最新的 WebDev Arena Leaderboard 基准测试中，Gemini 2.5 Pro I/ O 版以 1419.95 分的成绩一举超越 Claude 3.7 Sonnet 的 1357.10 分，成功登顶 AI 编程榜首。相比之前的 03-25 版本，这次的新模型在多项任务上都取得了显著进步。

新模型的定价与 Gemini 2.5 Pro 保持一致，每百万 token 输入和输出费用仅为 1.25 美元和 10 美元，相较于 Claude 3.7 Sonnet 更具性价比。

据谷歌博客介绍，Gemini 2.5 Pro I/ O 版在函数调用功能、错误率以及触发可靠性等方面都有显著改进。特别是在代码转换任务上，新模型的表现尤为出色。它能够根据单条文本提示生成完整的交互式网页应用或模拟程序，极大降低了设计导向型开发者的入门门槛。

此外，新模型在视频理解方面的表现同样令人印象深刻。在 VideoMME 基准测试中，它获得了 84.8% 的高分，位居榜首。这使得 Gemini 2.5 Pro I/ O 版不仅限于文本处理，还能高效地理解和操作视频内容。

谷歌 DeepMind CEO 戴密斯·哈萨比斯表示，这款模型是他迄今为止构建的最强编程模型。新模型的应用场景非常广泛，比如它可以自动统一视觉元素的风格匹配，将 YouTube 视频转化为学习应用，并快速生成响应式视频播放器等组件。

尽管谷歌尚未公开 Gemini 2.5 Pro 的具体架构细节，但可以肯定的是，这款模型正在从研究性创新向解决实际编程挑战的生产力工具转变。此次提前发布表明谷歌希望在重大会议之前满足开发者的期待，继续保持市场竞争力。

成年人为何更易陷入AI成瘾？原因揭秘

随着AI普及，成年人也逐渐表现出依赖迹象，甚至出现病理性成瘾。最新研究指出，互动频率、内容偏好和个体心理状态共同作用，导致一些人对AI产生似乎无法控制的依赖。这不仅影响日常生活和真实社交，还带来情绪波动和戒断反应。本文深入解析AI成瘾的成因、表现及潜在风险，提醒人们理性使用AI，关注心理健康。未来，AI设计应更注重“社会情感对齐”，避免过度拟人化带来的副作用。

80后何涛打造300家药店，圆心科技获腾讯红杉青睐

圆心科技成立于2015年，抓住处方药外流机遇，依托院边药房切入市场，结合线上问诊和智能医院服务，成功构建多元业务体系。历经11轮融资，公司估值飙升至275亿元，腾讯、红杉成为重要投资方。近年来，圆心科技持续扩大线下药房布局，开设300多家门店，线上用户量激增，努力打造“离患者最近的互联网医院”，引领医药零售和互联网医疗新风口。

谷歌Gemini 2.5 Pro I/O版强势登场，全面碾压Claude 3.7

谷歌最强编程模型 Gemini 2.5 Pro I/ O 版发布

编程能力大幅提升

迈向实用生产力工具

B站商业模式困境：UP主停更潮背后的故事

阿里限价看涨回购：如何聪明融资与防稀释

Meta「分割一切」模型新突破：检测、分割、生成三合一

激光雷达玩家盈利曙光初现？成本下降与技术竞争的双重博弈

英伟达：人工智能算力垄断的全球新帝国

马斯克：以商业之力重塑美国航天格局

阿里云全面接入通义千问，张勇展望大模型未来

COMPUTEX 2024: AI驱动掀起PC硬件创新浪潮

AI浪潮下，“美图秀秀们”何去何从？

Apple TV+携手中国移动布局中国市场，流媒体竞争格局再添变数

成年人为何更易陷入AI成瘾？原因揭秘

徕卡、蔡司、哈苏联名手机大战，谁真正实力派？

长盛轴承：掀起人形机器人产业的8倍涨势

人人视频为何深陷版权大战？揭秘其生存之道

80后何涛打造300家药店，圆心科技获腾讯红杉青睐