WWDC24:苹果AI大招,体验优势与技术挑战并存

4次阅读

共计 2963 个字符,预计需要花费 8 分钟才能阅读完成。

北京时间 6 月 11 日凌晨,一年一度的 WWDC24 主题演讲正式拉开帷幕。按照惯例,每年的这一盛会,苹果都会推出众多软硬件新品。而今年的 WWDC24 有着特殊之处,未发布新款硬件产品(国行版 Vision Pro 将于月底开售),在各大系统例行更新之外,带来了 AI 大招——Apple Intelligence。

苹果的 AI 大招:安全和隐私

Apple Intelligence 可被视为苹果推出的 AI 产品,它为 iPhone、iPad、Mac 等一系列硬件产品提供各类 AI 功能,与 iOS、macOS 等系统紧密相连。所以,Apple Intelligence 并非单独的 App 或功能,而是一套综合解决方案。

据苹果官方介绍,Apple Intelligence 基于内置的大模型,采用当下流行的端云结合模式。具体而言,在处理一般的涉及 AI 的任务时,若本地算力能够满足需求,便直接通过端侧模型来运行生成,以解决用户需求。然而,如果本地算力不足,Apple Intelligence 就会借助云端服务器来完成 AI 任务。苹果在 WWDC24 上多次着重强调了用户隐私安全的重要性,倘若苹果的云端 AI 采用通用方式,Apple Intelligence 的安全优势将会被消除。

为此,苹果采用了一种极为独特的形式。Apple Intelligence 搭建的云端服务器,采用苹果自家芯片,并使用 Swift 语言编程,服务器代码接受第三方专家审查。同时,苹果承诺,用户上传的数据不会在服务器上存储,用户隐私不会被苹果记录和知晓。

当然,若要用本地算力承担大部分 AI 需求,就需要 AI 性能出色的芯片。WWDC24 上,苹果公布了支持 Apple Intelligence 端侧运算的芯片要求,iPhone 端目前仅支持 A17 Pro 这一款芯片,即满足要求的只有最新款的苹果手机 iPhone 15 Pro 和 iPhone 15 Pro Max;PC 和 iPad 端支持的最老款芯片为 M1,基本涵盖了苹果所有 PC ARM 芯片,近几年的苹果 Mac 产品、iPad Pro/Air 基本都能支持。

目前来看,Apple Intelligence 更多与硬件而非系统版本绑定,老款 iPhone 受限于芯片性能,后续即便升级到最新系统,AI 体验也会大打折扣。但不得不说,Apple Intelligence 采用的端侧为主、云端为辅的模式,以及特殊的云端服务器部署方式,确实符合苹果一贯重视隐私安全的形象。这在很大程度上能减轻部分用户对 AI 产品隐私泄露的担忧,进而成为苹果产品未来的又一竞争优势。

Apple Intelligence 的核心优势:体验

实际上,仅通过一场 WWDC 的演讲,我们难以深入了解 Apple Intelligence 背后的技术细节。例如,外界并不清楚 Apple Intelligence 内置的大模型,是苹果自研成果,还是之前外界所爆料的外部采购品。

但无论如何,通过苹果官方在 WWDC 上的详细展示,我们已能初步知晓 Apple Intelligence 在苹果设备上能发挥的作用,以及用户日常使用时能获得怎样的体验提升。

依照苹果的说法,Apple Intelligence 能够充分理解设备中的各项数据和信息,包括照片、邮件、信息等。在此基础上,Apple Intelligence 能够感知用户当下情境中的需求,并提供恰当帮助。

首先,苹果的语言助手 Siri 变得更强大了,借助 Apple Intelligence 的助力,它各方面能力大幅增强,还能打通不同 App。苹果在 WWDC 上演示了一个功能:用户填写驾照号码时,直接呼出 Siri,它会在照片 App 中找到之前拍摄的带有驾照号码的照片,自动识别提取驾照号码,并自动为用户完成填写。

要实现这一点,Apple Intelligence 需要做到:感知用户当下要填写驾照号码的需求、识别照片 App 中的驾照照片、将这几处信息结合判断并满足用户需求。

此外,我们熟悉的文本摘要、文字生成等功能,Apple Intelligence 也能实现。其特殊之处在于,用户无需专门打开一款 App 或网址,直接在文本编辑界面即可呼出该功能。比如,写邮件时在编辑框内选中文字即可调用系统级的 AI 相关功能,生成后的文字会直接填充在编辑框中。

如此一来,用户便省去了在单独的 AI 工具中复制粘贴、来回折腾的麻烦,Apple Intelligence 带来的 AI 功能无处不在,融入到了苹果系统的每个角落。

WWDC24 上苹果还演示了多个有趣的 AI 功能,罗列如下:

Genmoji 表情包:可通过用户的文字描述自由定制个性化表情包,比如用朋友的照片生成带有其头像风格的照片。

Image Playground:支持文生图、图生图,具体有动图、插图、草图三种类型。

Image Wand:能将草图转化生成为精品成品图,并且支持图片消除,抹除照片背景。

通话录音:iPhone 终于支持这一功能,并且可以将通话转为文字。

总体而言,Apple Intelligence 带来的 AI 功能,基本不算特别新奇,其呈现形式和使用场景,对于见识过各类 AI 工具的人来说,都不是新鲜事物。但对于苹果用户而言,Apple Intelligence 的部署意味着他们在使用各类苹果设备时,也能享受到丰富全面的 AI 服务。

坦率地讲,WWDC24 上的主题演讲,给人的惊喜并不多。发布会前半部分仍是各大系统按部就班的更新,所谓的新功能大多平淡无奇,当看到 iOS 18 上的图标自定义排列、应用锁这类在国产定制系统中属于古董级别的功能被大肆宣扬时,内心满是失望。

WWDC24 上的绝对主角无疑是 Apple Intelligence,毕竟这是苹果交出的首份正式的 AI 答卷。在之前席卷而来的 AI 浪潮中,苹果仿佛置身事外,当安卓品牌纷纷在 AI 手机上发力时,苹果已被远远甩开。WWDC24 主题演讲快结束时,苹果透露了和 ChatGPT 在 AI 领域的合作,从一定程度上能看出苹果 AI 基础的先天不足。

所以,当作为追赶者的苹果发布 Apple Intelligence 时,很难让人从心底产生震撼的惊喜感。毕竟,文本摘要、图片生成、照片查找、AI 智能助理等一系列功能,我们此前已在安卓机或专门的大模型 App 中见过。说到底,苹果基于 Apple Intelligence 实现的各类 AI 功能,并不具备创新性。

然而,通过 WWDC24 上演示的内容,还是能深刻感受到 Apple Intelligence 的体验优势。

苹果以封闭系统起家,在过去十余年里将 iOS、macOS、iPadOS 等各类不同设备的系统融会贯通,保持着软硬件结合的优势,对自家系统生态的每个角落拥有绝对控制权。

因此,Apple Intelligence 能出现在苹果系统的每个细节处,与原有的 App 或功能相融合,用户可以更加自然、无感地借助 AI 的能力提升使用体验。

在这方面,安卓品牌更容易体会到无力感,推进端侧 AI 需要芯片厂商支持,将 AI 融入系统需要深度定制安卓系统,完成手机 AI 化后无法将 PC 与之融合。在不同形态设备上为用户提供统一且全面的 AI 体验,目前或许只有苹果能够做到。

不过,在笔者看来,任何 AI 相关的概念,无论前景描绘得多么美好,对用户而言能否转化为实用的功能以及切实改善体验才是关键。而苹果交出的 Apple Intelligence 这份 AI 答卷,最终能得几分,还需看其全面落地以及用户实际体验之后才能得出结论。

正文完
 0