AI绘画的未来:它会如何改变我们的创作方式?

21次阅读

共计 4169 个字符,预计需要花费 11 分钟才能阅读完成。

上个月当我提到 AI 绘画工具 Disco Diffusion(简称 DD)时,我仅仅把它当作一个例子,用来证明 AI 在创意性内容生成上的局限性,特别是在生成人脸和动物时还存在一些缺陷,需要人的干预调整。但是,随着技术的迭代,DD 的最新版本 5.6 引入了人像生成模块,显著提升了人脸生成的效果。虽然偶尔会出现一些变形或“玻尿酸感”,但它越来越能生成接近真实人的图像了。

尽管 AI 绘画的探索并不是新鲜事,早在 2015 年谷歌就推出了 DeepDream 来测试 AI 的艺术创作能力,但 2022 年以 DD 为代表的新一代 AI 绘画工具的崛起,不仅是技术的突破,更多的是它所生成的图像带来的视觉冲击。

如今,人们开始认真探讨 AI 绘画会对美术行业产生什么影响。即使 AI 无法完全取代人类艺术家,但它展示出来的生产力无疑能在创作中扮演重要的辅助角色,成为底稿、素材或灵感的来源。

除了为设计师和插画师提供工具外,AI 绘画也开始对普通人开放。无论是没有美术基础的人,只需按照教程输入描述词和调整参数,就能把想象中的图像变为现实。类似“和菜头”的公众号封面图,过去使用图库或版权,现在则由 AI 生成,想象力变得更为直观。

在行业中,已经有专业的文章普及技术原理,介绍各种 AI 绘画工具和使用方法。而我的兴趣在于,AI 绘画正在改变人们的生活和创作习惯,以及人们如何适应这种变化。

为此,我访谈了西乔,一位设计师和漫画《神秘的程序员》的主创。自今年 5 月以来,她几乎全力以赴投入到 AI 绘画的尝试中,每天生成图像、阅读相关论文、撰写科普文章。她对这项技术抱有巨大的期待,认为“AI 对艺术及插画的冲击,等同于‘相机的发明’,艺术史将迎来新的篇章。”

如果你想了解“AI 绘画工具是什么”,可以阅读更专业的文章。但如果你关心 AI 绘画“与我有什么关系”,“我能用它做什么”,或“它会带来什么”,那么继续往下读吧。

今年 4 月,关于 AI 绘画的讨论开始在中文网络上发酵。随着美术圈和程序圈从业者的互动,更多人逐渐熟悉 DD 这个开源项目。它在谷歌 Colab 中以代码形式呈现,用户只需输入关键词,系统就能生成图像。与以往的 AI 绘画工具相比,DD 无论在构图、色彩还是氛围方面都有了显著的提高。

与此同时,OpenAI 基于扩散模型和 CLIP 所提出的 DALL·E 2,以及 DD 的开发公司 Somnai 推出的 Midjourney 等其他工具也开始进入公众讨论的视野。设计师和插画师们开始制作“从零开始学习 AI 绘画”的教程,大家在 B 站、微博、知乎等社交平台上展开热烈讨论。

与大多数专业画师一样,西乔对 AI 绘画的热衷来自于它所提供的“可能性”。这种“可能性”不仅体现在创作流程的变革上,比如帮助设计师创造之前不敢尝试的风格。同时,她认为 AI 更像她创作过程中的另一只手,有时候可以将创作任务交给 AI,结果往往会带来不少惊喜。就像她在《西藏往事》系列作品中,AI 竟在雪山上放了一座塔吊,这种意外往往令人愉悦。

除了提词设计和参数调整外,还有一些更具控制性的玩法。当画师对生成结果有预期时,可以设计底图,并通过设置跳过步数来引导 AI 生成更接近原始图像的作品。通过这种方法,画师可以获得中间生成步骤,修改后再给 AI 完成,或者根据同一提词调整参数输出多组结果,选择更符合自己预期的部分进行二次创作。

双手并用的创作方式带来了更大的自由,也让西乔感受到学习新知识的乐趣,以及开盲盒的刺激。“晚上设置好参数,等着第二天挑选图像,虽然消耗了一些电,但带来的快乐却很值得。”比起盲盒有限的选择,AI 绘画的组合可能是无限的。

依赖于热爱创作的爱好者编写的中文资料、详细的教程,以及支持中文描述的 AI 绘画工具,这项技术逐渐在大众中引起关注。比如,自今年 5 月以来,和菜头多次发文介绍 AI 绘画。

技术的下沉使更多普通人能够接触到绘画,往往绘画对人来说是一扇未曾打开的门,或是高门槛的挑战。但 AI 让一些从未尝试过绘画的人,能够轻松创造出图像,不再依赖于长期的学习和经验积累。“人们创作图像的直觉是与生俱来的。许多人在小时候画出佳作,但随着成长受到的视觉模式影响,慢慢覆盖掉了那种直觉。”

当绘画变得和自拍一样,能被分享、满足成就感时,AI 绘画工具或许可以让普通人重新体验到失去的自由,享受创作的乐趣。目前,一些 AI 绘画平台提供将生成的艺术作品打印成挂画的服务,以供用户购买。

DD 这类基于文字生成图像的 AI 工具,绕不开一个叫“CLIP”的模型,它是理解人类语言的关键。CLIP(Contrastive Language–Image Pre-training)是一种跨模态预训练模型,由 OpenAI 于去年发布。DD 利用 CLIP 理解用户输入的文本,然后使用扩散模型生成图像。这一过程中,可以理解为给 AI 输入文本,AI 根据学习的数据集,从噪声中反推出图像,逐步调整细节,直到生成符合描述的图像。

以“宇航员骑马”和“马骑宇航员”的例子解释 AI 对语义的理解,前者 AI 能轻松生成,而后者则因“反常规”的描述则不易实现。

AI 能够创作出风格化图像,得益于庞大的训练数据集给它灌输的不同画家风格。例如在西乔的实验中,她发现,根据不同艺术家的风格,AI 提炼出作品的主题、笔触、肌理等特征。艺术家的名气和作品的多样性都会影响 AI 的学习,比如知名作家其作品特征可能更为突出。

例如,西乔用 DD 生成一幅蓝色海洋景观画,设定的画家是卡斯帕·大卫·弗里德里希,她发现生成的作品中总有黑衣背影。她推测这一元素出自于弗里德里希的名画《雾海旅人》。

除了学习不同艺术作品,画家的国籍和文化背景也会影响 AI 的理解。例如,使用中国艺术家的作品作为底图,就会偏向中国风。而使用日漫风格的艺术家进行肖像画生成,人物的面貌大概率也会有锥子脸和大眼睛的特点。

理解 AI 是如何“思考”的,调整描述词的撰写方法,也有助于更好地表达创作者的意图。

目前来看,AI 绘画工具对“绘画”的改变是系统性的。在创作过程中,它不仅赋予了新的技能和可能性,还成为艺术作品的新变量,影响作品的风格和价值,甚至以 NFT、拍卖等形式直接参与艺术市场的交易。

AI 还可以用于生成底图,画师基于其进行二次创作,或者作为远景素材。同时,画师也能轻松勾出底图交给 AI 生成出“幻想生物”作为创作灵感。在 AI 绘画的影响下,整个工具链可能会重新整合,从 AI 生成的多张图像中选择想要的用于插画创作,再通过 Photoshop 等工具精细调整。另一方面,AI 也在成为艺术评价的新变量。

艺术品的价值评判总是带有主观性,而且并非一成不变。随着新的艺术流派和媒介出现,必然面临一个接受和转变的时期。AI 绘画的评判标准如今依然存在争议,不知人们将沿用传统评判标准,还是会发展出适用于 AI 艺术的评论规范。西乔认为,这可能会成为未来艺术史研究和批评的重要课题,学者们会努力建立评价体系,而公众也会选择不同的标准。

虽然 AI 绘画工具显示出强大的生产能力,但实际上应用场景还是有差异。比如,AI 在场景概念图方面表现优异,很适合游戏、动漫等领域,但在工业设计或服装设计上却还未展现足够的能力。

与此同时,任何一项技术的商业化,必须考虑是否满足市场需求以及投入产出比。目前,AI 生成的图片尺寸还较小,DD 的生成宽边超过 1280 时,布局会不理想。而要得到适合打印的尺寸,还需后期放大或重新生成。

至于 AI 生成画直接用于售卖,行业内已有的案例,例如 2018 年一幅由艺术团体 Obvious 用 GAN 生成的肖像画,拍出了 432500 美元的高价。也有创作者将生成的图像铸造成 NFT 进行交易,但这一领域的不确定性很大,AI 更有希望挑战图库行业的商业模式。

随着 AI 绘画的普及,其某些功能也可能被滥用,带来负面影响。例如,通过添加“蒙版”,用户可以重绘图像的一部分,将大象的背影替换为正面照,又或是将苹果自然地放置在原本空无的茶几上。这种对想象的开放性意味着工具可以用于艺术创作和表达,但也可能成为伪造和制造假新闻的手段。

历史上,替换视频的“Deepfakes”曾频繁被用于不当事件,遭到限制。在中国流行的 AI 换脸应用“ZAO”,也因隐私和信息安全问题备受争议。

除了用户使用产生的垃圾内容,AI 在学习过程中也不可避免地吸纳了人类对性别、职业和种族的刻板印象,并在生成结果中潜移默化地反映出来。为了应对这些可能的负面影响,许多 AI 绘画工具的开发者采取了谨慎的开放策略,设置了更长的内测期和调整图像描述的过滤器。

国内开发者设计的 AI 绘画工具 Tiamat 曾解释说,AI 生成艺术是一个敏感且全新的领域,涉及到不可控性、合规性等多方面问题,需要多轮迭代才能确保用户体验。

OpenAI 近期的更新显示,DALL·E 在减少人种偏见方面取得了进展,努力更准确地反映人口的多样性。开发者对过滤器的调试也仍在摸索阶段,西乔提到自己多次被过滤器“拦住”,如“悬崖边祈祷”被系统判断为消极内容。

另外,AI 绘画面临的一个问题是“侵权的边界”,目前依然处于灰色地带,尚未有明确行业标准。像 DD 这样的工具虽然遵循 MIT 开源协议,理论上生成的图像可以免费商用,但在实际使用中,因描述词的使用而造成画风雷同,则容易引发抄袭争议。此外,用他人的作品作为底图经过 AI 生成后,权属界限同样模糊,是否构成侵权也需要更多的案例来厘清。

最后,西乔提醒,AI 绘画同样可能面临“负反馈”,即由 AI 生成的图像进一步影响 AI 模型的优化和训练,导致模型出现不可预知的放大效应。她喜欢用“相机”来比喻 AI 绘画,最初相机的技术发展也相当缓慢,使用繁琐,成像效果不稳定。但随着时间的推移,越来越多的艺术家将相机拍摄的照片作为绘画时的参考。“肖像画、风景画及数字绘画的变革都与相机的应用密切相关,不同形式的艺术创作也在不断进化。”

可以预见的是,AI 绘画工具的技术迭代将不会像相机那么缓慢。除了 DD、DALL·E 2 和 Midjourney 等主要工具,互联网巨头们也相继投入这个领域,谷歌的 Imagen、Meta 的 Make a Scene、微软的 NUWA 等等。同时,国内开发者们也积极参与全球 AI 艺术的发展。例如,Tiamat 正在举办“千人共创 -AI 艺术创作大赛”。

虽然人们对 AI 绘画的接触时间不长,当前的影响力大多在艺术圈和科技圈,但能够预见的是,AI 绘画或许能像相机那样,进入普通人的生活,创造出更多的艺术可能性。

正文完
 0