共计 1830 个字符,预计需要花费 5 分钟才能阅读完成。
近几年,生成式人工智能(AIGC)迅速走入公众视野,成为科技领域新的热门风口。此前,《Science》评选的 2022 年度十大科学突破中,AIGC 赫然其列。不少科技巨头和机构都将生成式 AI 视作继 NFT、元宇宙和 Web3 之后,又一个“爆火”领域。
AIGC 的爆发背后
这波浪潮的引爆点可追溯到游戏设计师杰森·艾伦用 AI 绘图工具 Midjourney 创作的作品《太空歌剧院》斩获美国科罗拉多州艺术博览会金奖。虽然 AI 生成内容的想法早已有之,早在 2017 年微软旗下 AI 部门小冰就推出了由 AI 独立撰写的诗集《阳光失了玻璃窗》,但这次才算在大众眼中“正式”亮相。
生成式 AI 的发展并非一蹴而就,更像是经过多年积累后被市场和技术共同催熟的结果。谷歌近期公布的音乐生成模型 MusicLM 就是一个代表,该模型可根据文字描述或图片生成高质量、各种类型的音乐作品。
技术与伦理的双重挑战
不过,尽管展示了大量惊艳成果,谷歌却没有公开发布 MusicLM,原因在于该技术尚存多重风险,包括技术不完善、版权争议及伦理问题。比如文字生成 AI ChatGPT 之所以迅速走红,一大关键就是其向公众开放,用户可以直接体验。而 MusicLM 因担忧音乐版权纠纷及生成作品的原创性,选择暂缓发布。谷歌透露,生成内容中约 1% 的音乐训练数据被直接复制,这引发了版权方面的严重顾虑。
实际上,版权和伦理问题是生成式 AI 产业普遍难以绕开的痛点。AIGC 模型需要数以万计小时乃至数百万小时的数据“喂养”进行训练,比如 MusicLM 的训练数据时长达 28 万小时。未经版权持有者同意使用作品进行训练,必然引起争议。
例如,有工程师在未经允许的情况下抓取迪士尼签约画师 Hollie Mengert 的作品,并训练出能模仿其画风的 AI 模型,这引发了广泛批评。以至于在日本等二次元绘画领域发达地区,“禁止 AI 学习”成为热门讨论话题。与此同时,对于 AI 生成内容所有权归属,业界也尚无统一定论。
艺术价值与市场认可的分歧
除了版权争议,生成式 AI 创作的作品是否具备真正艺术价值也存在争议。许多人认为艺术创作离不开人类主观情感和思维的投入,而 AI 只是在算法基础上拼凑已有素材,缺乏“灵魂”,因此即便表现精致,作品也可能流于平庸和机械。
但美国科罗拉多州艺术博览会的评委们在得知《太空歌剧院》由 AI 生成后,仍然决议授予大奖,也证明了社会对 AI 艺术价值认可有不同看法。
消费市场的态度也不统一。Getty Images 出于版权风险考量,禁止销售 AI 生成作品,而 Adobe 则支持通过 Stable Diffusion、DALL-E 2 等生成的艺术品在其平台销售。种种分歧反映出 AIGC 商业化之路仍充满变数。
巨头与创业企业的博弈
在这一轮生成式 AI 热潮中,初创企业如 OpenAI 和 Stability AI 反而成为了焦点,抢先落地了许多标志性产品。但这并不代表大公司如谷歌、Meta 不重视该领域。早在 OpenAI 推出 ChatGPT 前三个月,Meta 就发布过对话机器人 Blenderbot,然而由于对内容审核过严,该产品未能爆红。
技术发展带来的潜在风险让大型企业趋于谨慎,这从谷歌保留 MusicLM 未公开发布可见一斑。然而,在市场压力推动下,巨头们开始对冒险敞开怀抱。
与此同时,AI 伦理专家警示称,市场快速堆积生成式 AI 产品可能导致传播虚假信息、生成误导性图像甚至被学生滥用作弊,给社会带来隐忧。
商业化落地的现状与展望
目前,生成式 AI 产品普遍面临商业模型尚不明朗的问题。腾讯在 QQ 上线了“AI 画匠”,百度发布了“文心一格”AI 绘画应用,抖音也推出相关 AI 画图特效,这些产品曾一度引爆话题和流量,但新鲜感消退后热度迅速下滑,更多像是营销活动。
相较之下,工具化趋势正成为生成式 AI 商业化的重要方向。微软计划将 ChatGPT 集成到 Bing 搜索引擎及 Office 办公套件中,改变全球十亿用户的文档、演示和邮件处理方式。百度也传出将推出内嵌于搜索的对话机器人,进一步推动生成式 AI 在搜索和营销领域的应用。
不过,即便是 ChatGPT 这类被广泛认可的对话型 AI,也偶尔会产生与用户意图大相径庭的回答,这表明技术仍不成熟,距离广泛商业化还有距离。
行业研究机构 Gartner 预测,到 2025 年,生成式内容将占所有新生成数据的 10%。投资机构红杉资本更为生成式 AI 潜力点赞,认为它未来有望创造数万亿美元的经济价值。虽然当下仍有诸多挑战和不确定,但科技企业的投入已经表明,这场围绕生成式 AI 的竞赛已经打响。