共计 3331 个字符,预计需要花费 9 分钟才能阅读完成。
2012 年,计算机科学家吴恩达和 Jeff Dean 进行了一场试验。他们动用 1.6 万个 CPU、1000 万张猫咪图片以及当时全球最大的深度学习网络,耗时 3 天,生成了世界上第一张 AI 猫脸图像。那时候的小猫图片,受限于技术,称得上是“面目全非”。
12 年后,当网友首次看到背着白色翅膀的黑猫图片时,几乎都以为是真实照片。毕竟宠物博主给猫咪装扮后用胶片机拍照记录并不稀奇,直到看到帖子下方的“AIGC”标签,人们才惊讶发现这竟是 AI 生成的。怀揣好奇,众多网友前往名为“Recraft AI”的应用尝试生成理想小猫,随后各种“小猫胶片照”充斥了小红书、抖音等社交平台的信息流。
近年来,AI 生图成为离普通用户最近的 AI 进展。自 2021 年年初 OpenAI 发布 DALL- E 大模型,AI 能通过文字生图起,三年内 AI 生图工具不断进化迭代。有专攻技术能力突破的,如 Stable Diffusion、Midjourney、FLUX 等;也有专攻 C 端应用的,如妙鸭相机、Remini 等。如今这届网友正将 Recraft AI 捧上新“神坛”。
没有 AI 味的“造梦 AI”
此次 Recraft AI 火起来的是其内置的预设风格“Hard Flash”。该模式可模拟胶片摄影开启闪光灯后的效果,生成的图片主体突出、对比度高、色彩饱满浓郁。目前该 AI 网站支持免费用户每天获 50 个积分,生成 50 张图片,虽中文提示词生成效果不如英文,但支持中文口令直接输入。
若说 ChatGPT 让作者焦虑,Midjourney 让画家忧愁,这次慌的是摄影师。小红书是 Recraft 最初被国内用户关注的地方,相关话题下已有超 1 万条笔记。其中有摄影爱好者哀嚎“摄影不存在了”;专业胶片摄影博主认为其构图、色彩和审美佳,开始思索人类摄影师还能抓住什么;甚至有人研究其调色与构图进行“反向学习”。
尽管其他 AI 工具画风更细腻、图片更精美,但看多了有“AI 味儿”。早期“一眼假”是 AI 味儿,如今过于逼真无瑕也是。在追求细节和真实的 AI 绘画工具中,强烈鲜明的视觉风格是 Recraft 出圈关键。用不同模型输入相同口令“many animals”,Recraft 内置的 Hard Flash 模式有别样感觉。它没常规构图,将动物一字排开,画面大面积留白,似增添别样情绪,如展现出孤独的狮子。
当 AI 生成的画面能传达情绪,Recraft AI 被贴上“梦核”“怪诞”标签,激发了网友创作欲。有人输入喜欢的电影台词或歌词期待生成画面,如一条点赞 1.6 万的小红书笔记,博主“帆”将《宇宙探索编辑部》台词输入后,生成的图片虽不能百分百复刻台词内容,但画面风格很有特色。也有人用它记录梦境或表达情绪,还有热心网友整理提示词,甚至有人发现新商机,帮无法使用的用户生成梦核图片,一张几块钱。在网友热情参与下,继妙鸭相机、Remini 黏土特效后,又掀起一场 AI 狂欢浪潮。近期小红书、抖音等社交媒体充满各种奇妙图片,如 HelloKitty 站在窗边看烟花、小狗在雪地里吃蛋糕等。11 月 25 日,小红书官方科技薯发起活动,用户用 Recraft 生图带话题发布笔记有机会被推流。在社媒推动下,过去一周 Recraft 在国内 App Store 下载量跃升至“图形和设计榜单”第二。
AI 黑马,什么来头?
虽说 Recraft AI 已获大量国内网友喜爱,但“Hard Flash”模式并不能体现其技术实力。很多常用 AI 生图工具的用户认为,此前不少 AI 绘画大模型通过口令输入也能实现类似胶片效果。真正能证明 Recraft AI 实力的是今年发布的 Recraft V3 模型。
在正式官宣 Recraft V3 模型前,Recraft AI 曾用“red-panda”化名参与 Artificial Analysis 网站中 AI 图像竞技场投票,一举超过 FLUX、Midjourney、Ideogram、Stable Diffusion 3.5 排名第一,成为 AI 生成图像赛道黑马。因“red-panda”这个名字,起初很多人猜测模型背后是中国公司,直到今年 10 月 Recraft AI 在推特上认领该模型,人们才开始关注这家成立两年的 AI 企业。
Recraft AI 成立于 2022 年,总部位于英国。创始人兼首席执行官安娜•维罗尼卡•多罗古什此前在谷歌和微软从事软件工程工作,后加入俄罗斯最大搜索引擎平台 Yandex,是 CatBoost 开源梯度提升库的创造者。今年 1 月,Recraft AI 获得由美国风投机构 Khosla Ventures 领投的 1100 万美元 A 轮融资,GitHub 前首席执行官纳特•弗里德曼也参与其中,融资用于加速技术研发和市场拓展。
国内大多用户通过社交媒体上传播的“Hard Flash”模式了解 Recraft AI,所以常误以为它是像 Midjourney 那样的 AI 图像生成公司。但其实 Recraft AI 成立初衷是“专注于为平面设计师提供 AI 辅助工具”,比起 Midjourney,它更像 AI 版的 Cavan 或者 Photoshop。就连排名第一的 Recraft V3 模型,某种程度上也是为方便设计师生成海报而训练的。
在 Recraft V3 模型官方介绍博客中,该公司称此模型是“图像生成领域里,唯一可以生成带有长文本内容的 AI 图像模型”。比如设计师要在海报上展现大量文字内容,以往 AI 生图模型易在文字上出错,设计师通常先借助 AI 生成海报背景图,再用其他工具 P 上文字。而 Recraft V3 模型通过提升 AI 直接在图像中渲染文字内容的准确性,精简设计师利用 AI 生成海报的流程。AI 媒体“新智元”曾解释其运作机制:在构建文本信息时,Recraft 团队采用 TextDiffuser- 2 的表征方式,每行文本先记录内容,再通过坐标指明具体区域。与 TextDiffuser- 2 不同的是,Recraft 用三个坐标点表示文本,使模型能支持渲染倾斜文本。总之,借助 Recraft V3,设计师对海报中文字内容的生成效果与把控力大大提升。
除生成多种风格图像外,Recraft 还提供套索、局部重绘、抠图、mockup 等设计工具。体验过后,其 mockup 功能最令刺猬公社的设计同事惊艳。借助 AI 能力,Recraft AI 能实现图样或图标自动贴合产品图片,直接生成产品样图,省去设计师手动调整参数的麻烦。此外,Recraft 还引入实时协作功能,同一项目设计师可在无限画布上对生成内容评论并及时修改。
懂模型不够,还要懂内容
虽约 80% 的国内用户没把 Recraft AI 当成 AI 设计工具使用,但凭借 Hard Flash 走红也并非坏事。从 AI 生成图像领域历史看,最近 3 年竞争激烈,各大玩家都在更新大模型。2021 年年初 OpenAI 发布 DALL- E 大模型;2022 年 3 月 Midjourney 上线;2022 年 8 月 Stable Diffusion 正式开源;2024 年 8 月 Black Forest Labs 推出 FLUX 模型成为新领头羊……而 10 月,Recraft 成为讨论主角。
根据 Recraft AI 官方数据,Recraft V3 模型发布 20 天后,该应用全球累计注册用户超 200 万。每次注册登录时,Recraft 会询问用户得知途径,创始人多罗古什透露“几乎所有增长都来自社交媒体和用户口口相传”。
这背后的变化是,随着 AI 生成图像工具走进大众生活,AI 企业仅靠模型实力出圈不够。就像多罗古什所说:“仅靠生成高质量 AI 图像不够,(产品)还需建立吸引人们注意力的东西。”以往一些面向 C 端的 AI 产品已证明这点,如去年的妙鸭相机和今年上半年的 Remini,分别凭借“AI 写真”和“黏土特效”在用户心中留下深刻标签。
对于 Recraft AI 来说,Hard Flash 带来的胶片感是其在社媒出圈、形成认知的“抓手”。在追求画面细节与真实感的 AI 模型中,Recraft 切入允许不合常理的“想象力”赛道。一方面,风格统一的滤镜画风加深用户记忆,让 Recraft 名字扎根;另一方面,巧妙掩盖了 AI 模型部分能力欠缺,就算生成人物有塑料感、画面常以彩色幕布为背景,在“梦核”“怪诞”风格标签下也变得合理。
AI 企业追求技术突破仍是当下重点,但要让更多普通用户走进 AI 时代,除突破性技术,还需降低使用门槛、选好产品定位及营销策略,这样才能有更多 AI 产品“飞入寻常百姓家”。