GPT-4震撼发布!ChatGPT迎来重大升级

22次阅读

共计 1467 个字符,预计需要花费 4 分钟才能阅读完成。

一觉醒来,备受瞩目的 GPT- 4 闪亮登场!OpenAI 老板 Sam Altman 直接点明:这是迄今为止功能最为强大的模型。

GPT- 4 究竟有多厉害?据 OpenAI 官方介绍,它是一个超大型的多模态模型,输入既可以是文字(上限 2.5 万字),也能够是图像。比如展示手套掉落的情景,它能准确说出会掉到木板上且球会被弹飞;简单在纸上画个网站草稿图,拍照上传给 GPT-4,它就能立刻生成网站的 HTML 代码。在性能表现方面,OpenAI 宣称其在各种专业和学术基准上与人类相当。

此次 OpenAI 可不只是发布 GPT-4,还同步进行了一系列大动作:推出集成 GPT- 4 的 ChatGPT 升级版 ChatGPT Plus,发布 GPT- 4 的 API,公布技术论文并公开 System Card。不仅如此,传闻的“必应早就用上了 GPT-4”也得到微软证实。自 ChatGPT 问世以来,微软和谷歌间的数轮科技战役,微软此次又大获全胜。不少网友都感叹见证了历史,称其为史上最强大模型。

正如之前传言,GPT- 4 具备多模态能力,能接受图像输入并理解图像内容,文字输入长度也增加到 3.2 万个 token(约 2.4 万单词)。升级后的 GPT- 4 在各类职业和学术考试中表现与人类水平相近。比如模拟律师考试,GPT- 4 取得前 10% 的佳绩,而 GPT-3.5 则处于倒数 10%;做美国高考 SAT 试题,GPT- 4 在阅读写作中拿到 710 分高分,数学 700 分(满分 800)。

那么 GPT- 4 的这些新能力实际使用起来效果如何呢?技术报告给出了不少展示。其看图能力可用于解释表情包、梗图,比如提问一张图哪里好笑,它能按顺序描述每一格内容并总结笑点,像用巨大的过时 VGA 接口给小巧的现代智能手机充电。更进一步,它能理解图表中数据含义并做进一步计算,甚至把论文截图发给它,它能按像素处理文字和图片,给出论文总结摘要。

文字输入长度限制的增加,极大扩展了 GPT- 4 的实用性。发布会直播上,OpenAI 总裁 Gregman 现场展示了 GPT- 4 给代码修 Bug 的过程。出现问题不用多想,直接把 1 万字的程序文档一股脑扔给它就行,格式也不用管,复制粘贴即可,再附上问题,几秒钟就能得到解决办法。在 API 方面,GPT- 4 开放了修改“系统提示”的功能。此前 ChatGPT 回答冗长平淡,是因为系统提示规定了“你只是一个语言模型……你的知识截止于 2021 年 9 月”,现在修改这句话,GPT- 4 就能展现更多样性格,比如扮演苏格拉底,也可指定回答形式,比如全用 json 格式。

尽管 GPT- 4 能力大幅升级,但之前 ChatGPT 会出现幻觉、胡说八道的问题仍未完全解决。从官方示例能看出,要充分发挥 GPT- 4 的能力,最好运用思维链路提示,操作很简单,提问时额外提醒 AI 给出步骤,就能大幅提高推理和计算的准确率。

就在 GPT- 4 发布前,谷歌为迎战微软,宣布将一系列即将推出的 AIGC 功能应用到自家产品中,包括谷歌 Docs(文档)、Gmail、Sheets(表格)和 Slides(幻灯片)。不过与微软和 OpenAI 的“发布即可用”不同,谷歌只会先将 Docs 和 Gmail 中的 AI 工具在月底提供给一些“值得信赖的开发人员”,其他功能则在今年晚些时候向公众开放,具体时间未明确说明。外界认为谷歌是想抢先微软原定于本周四的发布,但从今日结果看,微软依旧提前“抢滩登陆”。

在 GPT- 4 发布前,就有网友做出 GPT- 3 和 GPT- 4 参数量的对比图,并猜测 GPT- 4 参数量将达 100 万亿。此次也有网友预言了未来 GPT- 5 的参数量情况。无论如何,这一次,我们距离真正的人工智能又迈进了一步。

正文完
 0