GPT-4震撼发布！ChatGPT迎来重大升级

173次阅读

共计 1467 个字符，预计需要花费 4 分钟才能阅读完成。

一觉醒来，备受瞩目的 GPT- 4 闪亮登场！OpenAI 老板 Sam Altman 直接点明：这是迄今为止功能最为强大的模型。

GPT- 4 究竟有多厉害？据 OpenAI 官方介绍，它是一个超大型的多模态模型，输入既可以是文字（上限 2.5 万字），也能够是图像。比如展示手套掉落的情景，它能准确说出会掉到木板上且球会被弹飞；简单在纸上画个网站草稿图，拍照上传给 GPT-4，它就能立刻生成网站的 HTML 代码。在性能表现方面，OpenAI 宣称其在各种专业和学术基准上与人类相当。

此次 OpenAI 可不只是发布 GPT-4，还同步进行了一系列大动作：推出集成 GPT- 4 的 ChatGPT 升级版 ChatGPT Plus，发布 GPT- 4 的 API，公布技术论文并公开 System Card。不仅如此，传闻的“必应早就用上了 GPT-4”也得到微软证实。自 ChatGPT 问世以来，微软和谷歌间的数轮科技战役，微软此次又大获全胜。不少网友都感叹见证了历史，称其为史上最强大模型。

正如之前传言，GPT- 4 具备多模态能力，能接受图像输入并理解图像内容，文字输入长度也增加到 3.2 万个 token（约 2.4 万单词）。升级后的 GPT- 4 在各类职业和学术考试中表现与人类水平相近。比如模拟律师考试，GPT- 4 取得前 10% 的佳绩，而 GPT-3.5 则处于倒数 10%；做美国高考 SAT 试题，GPT- 4 在阅读写作中拿到 710 分高分，数学 700 分（满分 800）。

那么 GPT- 4 的这些新能力实际使用起来效果如何呢？技术报告给出了不少展示。其看图能力可用于解释表情包、梗图，比如提问一张图哪里好笑，它能按顺序描述每一格内容并总结笑点，像用巨大的过时 VGA 接口给小巧的现代智能手机充电。更进一步，它能理解图表中数据含义并做进一步计算，甚至把论文截图发给它，它能按像素处理文字和图片，给出论文总结摘要。

文字输入长度限制的增加，极大扩展了 GPT- 4 的实用性。发布会直播上，OpenAI 总裁 Gregman 现场展示了 GPT- 4 给代码修 Bug 的过程。出现问题不用多想，直接把 1 万字的程序文档一股脑扔给它就行，格式也不用管，复制粘贴即可，再附上问题，几秒钟就能得到解决办法。在 API 方面，GPT- 4 开放了修改“系统提示”的功能。此前 ChatGPT 回答冗长平淡，是因为系统提示规定了“你只是一个语言模型……你的知识截止于 2021 年 9 月”，现在修改这句话，GPT- 4 就能展现更多样性格，比如扮演苏格拉底，也可指定回答形式，比如全用 json 格式。

尽管 GPT- 4 能力大幅升级，但之前 ChatGPT 会出现幻觉、胡说八道的问题仍未完全解决。从官方示例能看出，要充分发挥 GPT- 4 的能力，最好运用思维链路提示，操作很简单，提问时额外提醒 AI 给出步骤，就能大幅提高推理和计算的准确率。

就在 GPT- 4 发布前，谷歌为迎战微软，宣布将一系列即将推出的 AIGC 功能应用到自家产品中，包括谷歌 Docs（文档）、Gmail、Sheets（表格）和 Slides（幻灯片）。不过与微软和 OpenAI 的“发布即可用”不同，谷歌只会先将 Docs 和 Gmail 中的 AI 工具在月底提供给一些“值得信赖的开发人员”，其他功能则在今年晚些时候向公众开放，具体时间未明确说明。外界认为谷歌是想抢先微软原定于本周四的发布，但从今日结果看，微软依旧提前“抢滩登陆”。

在 GPT- 4 发布前，就有网友做出 GPT- 3 和 GPT- 4 参数量的对比图，并猜测 GPT- 4 参数量将达 100 万亿。此次也有网友预言了未来 GPT- 5 的参数量情况。无论如何，这一次，我们距离真正的人工智能又迈进了一步。

正文完