GPT-4o火爆：免费生图登王座，行业变革进行时

230次阅读

共计 2373 个字符，预计需要花费 6 分钟才能阅读完成。

OpenAI 又一次在全网掀起了热潮，而且这股由 GPT-4o 引发的热浪已经持续近一周，丝毫没有停歇的迹象。如今，免费用户也能够使用生图功能了，这使得更多人纷纷涌入 GPT-4o 的世界。

依靠吉卜力图像实现的病毒式传播，着实让奥特曼以及整个 OpenAI 团队都始料未及。继出现「GPU 熔化」的情况后，昨天奥特曼甚至向用户发出请求：请大家不要再生成图片了，团队急需休息。面对众人的高涨热情，奥特曼在 X 上开心地宣布：在过去的一小时内，ChatGPT 的新增用户数量就突破了一百万！

就在不久前，GPT-4o 在生图领域登上了王座。根据独立 AI 评测机构 Artificial Analysis 的测试结果，GPT-4o 实至名归，在图像竞技场中凭借 ELO 评分与其他模型并列第一，超越了 Recraft V3、FLUX 1.1[Pro 版] 和 Gemini 2.0 Flash 等。在细分领域的测试里，该模型在「文字排版」、「人物肖像」、「动漫」以及「科幻题材」等方面表现格外突出，位居榜首。

网友们的疯狂实测进一步证明，如今的 GPT-4o 捧起这个奖杯是当之无愧的，是实实在在的断层第一。

外行看个热闹，内行则关注门道。这下子，视觉特效、广告设计等行业的专业人士可坐不住了。

从事 AI 生成和 AI 视频的 Anu Aakash，分享了 GPT-4o 呈现出的虚实结合的视觉特效：逼真得令人惊叹，抽象得超乎想象。以下这些图片均是由 AI 生成的。

首先是具有奢华生活风格的 Lady Gaga，由 AI 直接生成，无需进行编辑；还有未来 OpenAI 的 CEO 奥特曼的悲惨生活场景，他在街头求职，却被机器人无情地忽视；有宫崎骏老爷子的现实主义和吉卜力风格相混搭的肖像；特朗普、马斯克和万斯仿佛回到大学时代，在地下室肆意狂欢的疯狂 Party 画面；美国前总统林肯穿越时空，和迈克尔·杰克逊正在高中派对上尽情狂欢（注意背景后那只奇怪的手，还留有 AI 生成的痕迹）；特写镜头下，雨中年轻的东欧女子，雨水打在花脸妆上，逼真得让人害怕；动漫 Scooby-Doo 中的角色 Fred Jones，写实风格达到了恐怖的程度；红心皇后从扑克牌中优雅地走出，甚至还能一键将女王变成国王，亲测有效；印象派大画家梵高身处繁华街道，抗议「艺术已死」；超现实主义大师萨尔瓦多·达利举起「这才刚开始」的牌子；行为艺术展示老奶奶用网线织毛衣，堪称抽象摄影艺术；在线广告中，老虎托尼肌肉夸张，眼神火热。

除了网友们这些充满想象力的创意图片，在专业的视觉设计领域，GPT-4o 也开始崭露头角。

从事网站可视化设计的设计师 Dan 分享了一些他使用 GPT-4o 进行品牌图像创作的实例。他表示这些设计为他节省了数天的工作时间。Dan 称，在以往的工作流程中，光是搞定一些基础的东西，就得花费好几天，甚至整整一个星期的时间。等到真正开始着手做产品时，早已没了激情。但现在有了 AI 的辅助，情况大为不同。

比如，以一款个人银行应用程序为例。只需告知 GPT-4o 创建一张公司品牌概述图片，并附上模板，然后等待它输出即可。当然，为了使结果更符合预期，还可以添加一些更详细的提示信息，比如交代公司的背景、品牌元素，以及使用的字体和色系等细节。这样一来，这款银行的设计元素就能轻松搞定。

接下来，他设计了一个名为波长的复古音乐流媒体应用。他要求 GPT-4o 设计得美观现代，融入品牌颜色和元素，背景也要体现品牌特色，采用拟物、复古、彩色和柔和色调风格。可以看出，这个设计的色系及风格充满了复古情怀。

不止是应用方面，Dan 还设计了一个多语言学习平台。他让 GPT-4o 创建一个品牌概述图表，展示 MultiLingua（语言学习平台）的品牌元素，包括 Logo、色板、字体、渐变、图标和插图，采用「bento box」风格布局。同时要求设计美观现代，融入品牌颜色和元素，背景也要体现品牌特色，使用有趣、可爱、俏皮、柔和色调、渐变和动物灵感风格。结果 GPT-4o 同样出色地满足了他的需求，生成的设计色彩柔和、俏皮可爱。

看到 GPT-4o 这些令人惊叹的输出，一些设计师感到「天塌了！」。有设计背景的网友 Val Sopi 就表示，这太不可思议了，现在只要把想法说出来，好的设计就能神奇地实现。「这个职业可能要走到尽头了。」他写道。

甚至，已经有大胆的网友开始利用 GPT-4o 伪造收据了。风投家 Deedy 在 X 上分享了一张收据，显示自己在旧金山牛排馆消费了 185 刀。然而，这张收据从头到尾都是假的，根本就不存在这样的消费。也就是说，真实图像作为证据的时代，恐怕从此要彻底终结了。如果觉得生成的收据还不够逼真，那就让 GPT-4o 再多生成一些食物或饮料的污渍，并且让上面的字更自然地随着纸张弯曲。要是还想要更自然的效果呢？一位法国用户发出了一张皱皱巴巴的本地餐厅收据，褶皱的程度相当自然。TechCrunch 的记者也亲自进行了实测，生成了旧金山某餐厅的假收据。不过，这一次 GPT-4o 稍微出现了一点小失误，露出了几处破绽，比如金额的总数使用了逗号，数学计算也不正确。但对于那些存心诈骗的人来说，把这些错误通过 PS 处理掉，或者根据提示进行修改，并不是什么难事。不仅如此，各种车票、机票、比赛门票等，都能够随手伪造出来，逼真到难以鉴定真假。

那么，有什么办法可以对这些伪造的票据进行鉴定呢？有人提出，ChatGPT 创建的图片会嵌入隐藏的水印，可以前往鉴别 AI 的网站上，鉴定出图片的来源。OpenAI 发言人 Taya Christianson 也表示，所有 GPT-4o 图像都嵌入了元数据，因此大多数 app 能够将它们检测出来。可是，如果不法分子利用 GPT-4o 生成虚假证据来实施欺诈行为，该如何应对呢？对此，发言人表示，OpenAI 的目标是给予用户尽可能多的创作自由。而虚假的 AI 收据，可以应用于许多非欺诈场景，比如教授财务知识，生成原创艺术和产品广告等等。

正文完