AI创作新势力崛起:AIGC爆发的底层逻辑探秘

21次阅读

共计 2724 个字符,预计需要花费 7 分钟才能阅读完成。

未来的艺术展,会不会变成机器人之间的 PK?几十年前,这或许是遥远科幻,但在 AI 飞速发展的当下,回答需深思。2018 年,AI 创作的《埃德蒙·贝拉米画像》在纽约佳士得拍卖行以 43.25 万美元拍出,是估价 40 多倍,成为首幅被拍卖的 AI 作品。去年 9 月,《太空歌剧院》获美国科罗拉多州博览会艺术比赛金奖,竟是用 AI 作画工具完成,赛后评委表示即便早知是 AI 作品也会授最高奖,引发 AI 创作作品能否参赛的大讨论。与火遍全球的 ChatGPT 相比,AI 作画似只是开胃菜,ChatGPT 能作诗、编小说、写代码,上线俩月收获 1 亿用户,马斯克称其强大到危险,比尔·盖茨认为其诞生不亚于互联网和个人电脑。AI 作画、ChatGPT 都属 AIGC,即人工智能生成内容。

AIGC 潜力不容小觑,据预测,2022 年后将迎来应用爆发,市场空间从 2022 年的 108 亿美元涨至 2032 年的 1181 亿美元,10 年复合增速达 27%。了解其演进历程和底层逻辑至关重要。

技术、需求双轮驱动

AIGC 看似一夜爆发,实则多年技术沉淀。1957 年,第一支由计算机创作的音乐作品《依利亚克组曲》诞生,被视为 AIGC 起点。但人工智能发展初期,受多种因素限制,算法基于预设规则或模板,不够智能,高昂系统成本难带来可观商业变现,各国政府减少人工智能领域投入,AIGC 进展不显著。

AIGC 真正受市场关注,源于近年深度学习生成算法涌现,如生成式对抗网络(GAN)、Transformer、扩散模型(Diffusion Model)等,为 AI 高品质输出内容奠定基础。画出《太空歌剧院》的 Midjourney 参考 CLIP 和 Diffusion 构建闭源模型,ChatGPT 的底层 AI 大模型 GPT3.5 的底层技术来自谷歌的 Transformer。

若技术推动是 AIGC 发展的左脚,创新需求牵引则是右脚。用户对内容数量和质量需求激增,传统内容生产模式暴露短板。内容生产方式分三类:专业生成内容(PGC)、用户生成内容(UGC)、人工智能生成内容(AIGC)。PGC 制作标准高、周期长,因供给端人力资源有限,难以满足大规模内容生产需求;UGC 满足个性化需求、提高容量上限,但质量无保障。AIGC 虽无法替代前两者,但能优化。借助 AIGC,创作者可提升内容专业性,AI 能辅助专业创作者提高效率。在文本领域,腾讯的“梦幻写手”新闻写作系统能在 22 种场景写作,平均发稿速度 0.46 秒;在音频领域,Siri 联合创始人打造的 LifeScore 平台,用户输入音乐“原材料”,AI 会改编并实时混音。

如何打出新型“闪电战”?

英国人发明坦克,德国人发明基于坦克的闪电战。新技术诞生后,谁能极致运用谁占主动。本轮生产力革命受益者,不仅是 AIGC 技术发明人,更是模式创新先行者。如互联网以浏览器为起点,衍生出社交网络、电商、视频、游戏等新模式。

在电商行业,AIGC 降低商家和用户交易成本。2021 年 4 月,阿里巴巴上线 3D 版天猫家装城,帮助商家构建 3D 购物空间,消费者可 DIY 家装搭配,沉浸式“云逛街”。数据显示,3D 购物转化率平均值为 70%,较行业平均水平提升 9 倍,同比正常引导成交客单价提升超 200%,商品退换货率明显降低。

在金融行业,AIGC 增强企业品牌粘性。2022 年年初,商汤科技为宁波银行上海分行打造数字人员工“小宁”,去年 12 月 16 日,“小宁”主持线上直播活动,可幽默介绍工作、推荐金融产品和福利。商汤数字人“虚拟 IP”可自主直播运营,降低业务运营成本,实现全天候“用户触达”。数字人商业潜力巨大,据预测,到 2030 年中国虚拟人整体市场规模将达 2700 亿元,其客单价相对更高。小冰 CEO 李笛称,将生成能力捆绑在数字人身上后,平均客单价从 20 万提高到 300 万。

目前,以 ChatGPT 为代表的自然语言技术突破,降低 AI 使用和触达门槛,AIGC 商业化表现出色。2021 年成立的 Jasper 通过文字生成功能,为用户提供多种文案创作服务,成立当年就有 7 万多名客户,包括知名企业,2021 年创收 4000 万美元,2022 年预估收入 7500 万美元。随着相关技术发展优化,AIGC 产业商业化应用将更广泛深入,能助企业提效、降本、升竞争力,为用户提供个性化、智能化服务体验。

AIGC 掀起“三大军备竞赛”

AIGC 爆发吸引知名投资机构关注。去年 9 月,红杉美国发表文章认为 AIGC 将引发众多产业范式转移,若技术按当前速度发展,AI 写备忘录、文字转皮克斯电影的科幻未来不再遥远。

目前 AIGC 领域掀起三重“军备竞赛”。第一重军备赛是更大的模型,让 AIGC 更会表达。AIGC 生成的多模态内容结构和语义复杂,需强大学习和表达能力的模型,大模型因参数多、网络结构深、学习数据丰富,能更好拟合和表达生成任务模式和特征,实现高质量内容生成。如 ChatGPT 的底层大模型 GPT-3.5 包含 1750 亿参数,调用 8000 亿个单词训练数据;商汤科技的视觉大模型参数达 320 亿,是公开信息中计算机视觉领域参数量最大的模型。随着数据量和计算能力增加,视觉大模型未来几年将显著发展。打造大模型不仅取决于算法,还需丰富产业实践经验,商汤科技自 2016 年全面布局 AIGC 多模态数据分析和内容生产,形成正循环。

第二重军备赛点是更高的算力。大算力支持复杂模型和大规模数据训练,提高 AIGC 生成内容质量、多样性、生产效率和速度,支持实时生成和个性化定制,但获取大算力成本高昂,一般小企业难以负担。如构建智能算力集群成本超 30 亿元。成都智算中心和商汤临港人工智能智算中心已上线高算力规模,为算法模型分析、训练和数据管理提供支撑。

第三军备竞赛点是让应用门槛更低,让 AIGC 应用更普惠。OpenAI 开放 ChatGPT 和语音转文本模型 API,降低使用成本;谷歌的 AutoDraw 应用程序帮助用户自动转换图形;商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”并开源,在多模态多任务处理能力上有突破,为通用场景任务提供支持,是向通用人工智能迈出的坚实一步。

写在最后

演化经济学家卡萝塔·佩蕾丝在《技术革命与金融资本》中指出,每轮技术革命经历导入期(爆发阶段、狂热阶段)和展开期(协同阶段、成熟阶段)。导入期新技术在少数行业示范,热钱涌入,示范效果好则进入展开期,展开期技术和制度框架协调,国家达到高就业水平,被视为“黄金时代”。当下,智能驾驶、智能监控、AIGC 产业等 AI 细分赛道爆发,示范效应或推动人工智能产业从导入期进入展开期。随着 ChatGPT 等应用出现,AI 产业演进方向更明确,即通过大模型结合大算力实现通用型 AI,让非资深企业和个人享受技术进步。提前布局大模型及强算力者将构筑更高壁垒,更早收获产业红利。

正文完
 0