共计 2373 个字符,预计需要花费 6 分钟才能阅读完成。
OpenAI 又一次在全网掀起了热潮,而且这股由 GPT-4o 引发的热浪已经持续近一周,丝毫没有停歇的迹象。如今,免费用户也能够使用生图功能了,这使得更多人纷纷涌入 GPT-4o 的世界。
依靠吉卜力图像实现的病毒式传播,着实让奥特曼以及整个 OpenAI 团队都始料未及。继出现「GPU 熔化」的情况后,昨天奥特曼甚至向用户发出请求:请大家不要再生成图片了,团队急需休息。面对众人的高涨热情,奥特曼在 X 上开心地宣布:在过去的一小时内,ChatGPT 的新增用户数量就突破了一百万!
就在不久前,GPT-4o 在生图领域登上了王座。根据独立 AI 评测机构 Artificial Analysis 的测试结果,GPT-4o 实至名归,在图像竞技场中凭借 ELO 评分与其他模型并列第一,超越了 Recraft V3、FLUX 1.1[Pro 版] 和 Gemini 2.0 Flash 等。在细分领域的测试里,该模型在「文字排版」、「人物肖像」、「动漫」以及「科幻题材」等方面表现格外突出,位居榜首。
网友们的疯狂实测进一步证明,如今的 GPT-4o 捧起这个奖杯是当之无愧的,是实实在在的断层第一。
外行看个热闹,内行则关注门道。这下子,视觉特效、广告设计等行业的专业人士可坐不住了。
从事 AI 生成和 AI 视频的 Anu Aakash,分享了 GPT-4o 呈现出的虚实结合的视觉特效:逼真得令人惊叹,抽象得超乎想象。以下这些图片均是由 AI 生成的。
首先是具有奢华生活风格的 Lady Gaga,由 AI 直接生成,无需进行编辑;还有未来 OpenAI 的 CEO 奥特曼的悲惨生活场景,他在街头求职,却被机器人无情地忽视;有宫崎骏老爷子的现实主义和吉卜力风格相混搭的肖像;特朗普、马斯克和万斯仿佛回到大学时代,在地下室肆意狂欢的疯狂 Party 画面;美国前总统林肯穿越时空,和迈克尔·杰克逊正在高中派对上尽情狂欢(注意背景后那只奇怪的手,还留有 AI 生成的痕迹);特写镜头下,雨中年轻的东欧女子,雨水打在花脸妆上,逼真得让人害怕;动漫 Scooby-Doo 中的角色 Fred Jones,写实风格达到了恐怖的程度;红心皇后从扑克牌中优雅地走出,甚至还能一键将女王变成国王,亲测有效;印象派大画家梵高身处繁华街道,抗议「艺术已死」;超现实主义大师萨尔瓦多·达利举起「这才刚开始」的牌子;行为艺术展示老奶奶用网线织毛衣,堪称抽象摄影艺术;在线广告中,老虎托尼肌肉夸张,眼神火热。
除了网友们这些充满想象力的创意图片,在专业的视觉设计领域,GPT-4o 也开始崭露头角。
从事网站可视化设计的设计师 Dan 分享了一些他使用 GPT-4o 进行品牌图像创作的实例。他表示这些设计为他节省了数天的工作时间。Dan 称,在以往的工作流程中,光是搞定一些基础的东西,就得花费好几天,甚至整整一个星期的时间。等到真正开始着手做产品时,早已没了激情。但现在有了 AI 的辅助,情况大为不同。
比如,以一款个人银行应用程序为例。只需告知 GPT-4o 创建一张公司品牌概述图片,并附上模板,然后等待它输出即可。当然,为了使结果更符合预期,还可以添加一些更详细的提示信息,比如交代公司的背景、品牌元素,以及使用的字体和色系等细节。这样一来,这款银行的设计元素就能轻松搞定。
接下来,他设计了一个名为波长的复古音乐流媒体应用。他要求 GPT-4o 设计得美观现代,融入品牌颜色和元素,背景也要体现品牌特色,采用拟物、复古、彩色和柔和色调风格。可以看出,这个设计的色系及风格充满了复古情怀。
不止是应用方面,Dan 还设计了一个多语言学习平台。他让 GPT-4o 创建一个品牌概述图表,展示 MultiLingua(语言学习平台)的品牌元素,包括 Logo、色板、字体、渐变、图标和插图,采用「bento box」风格布局。同时要求设计美观现代,融入品牌颜色和元素,背景也要体现品牌特色,使用有趣、可爱、俏皮、柔和色调、渐变和动物灵感风格。结果 GPT-4o 同样出色地满足了他的需求,生成的设计色彩柔和、俏皮可爱。
看到 GPT-4o 这些令人惊叹的输出,一些设计师感到「天塌了!」。有设计背景的网友 Val Sopi 就表示,这太不可思议了,现在只要把想法说出来,好的设计就能神奇地实现。「这个职业可能要走到尽头了。」他写道。
甚至,已经有大胆的网友开始利用 GPT-4o 伪造收据了。风投家 Deedy 在 X 上分享了一张收据,显示自己在旧金山牛排馆消费了 185 刀。然而,这张收据从头到尾都是假的,根本就不存在这样的消费。也就是说,真实图像作为证据的时代,恐怕从此要彻底终结了。如果觉得生成的收据还不够逼真,那就让 GPT-4o 再多生成一些食物或饮料的污渍,并且让上面的字更自然地随着纸张弯曲。要是还想要更自然的效果呢?一位法国用户发出了一张皱皱巴巴的本地餐厅收据,褶皱的程度相当自然。TechCrunch 的记者也亲自进行了实测,生成了旧金山某餐厅的假收据。不过,这一次 GPT-4o 稍微出现了一点小失误,露出了几处破绽,比如金额的总数使用了逗号,数学计算也不正确。但对于那些存心诈骗的人来说,把这些错误通过 PS 处理掉,或者根据提示进行修改,并不是什么难事。不仅如此,各种车票、机票、比赛门票等,都能够随手伪造出来,逼真到难以鉴定真假。
那么,有什么办法可以对这些伪造的票据进行鉴定呢?有人提出,ChatGPT 创建的图片会嵌入隐藏的水印,可以前往鉴别 AI 的网站上,鉴定出图片的来源。OpenAI 发言人 Taya Christianson 也表示,所有 GPT-4o 图像都嵌入了元数据,因此大多数 app 能够将它们检测出来。可是,如果不法分子利用 GPT-4o 生成虚假证据来实施欺诈行为,该如何应对呢?对此,发言人表示,OpenAI 的目标是给予用户尽可能多的创作自由。而虚假的 AI 收据,可以应用于许多非欺诈场景,比如教授财务知识,生成原创艺术和产品广告等等。