共计 2887 个字符,预计需要花费 8 分钟才能阅读完成。
近日,一个叫 ChatGPT 的聊天机器人彻底出圈,在网络上掀起热潮。它能编写代码、修复漏洞,还能撰写工作周报、创作小说、进行高考答题,甚至能被诱导规划毁灭人类的方法。尽管市面上已有众多聊天机器人,马斯克仍感叹:“很多人疯狂陷入 ChatGPT 循环,我们离强大到危险的人工智能不远了。”
ChatGPT 是美国 OpenAI 开发的大规模预训练语言模型,马斯克曾是该公司创始人之一。12 月 5 日,OpenAI 首席执行官 Sam Altman 在社交媒体发文称,ChatGPT 上周三推出,截至目前已突破 100 万用户,免费公测版本的服务器很快被热情用户挤爆。
联想集团副总裁、联想创投集团高级合伙人宋春雨表示,AI 预训练大模型的出现,成为近三年来 AI 算法创新最受关注的投资机会。睿兽分析显示,2022 年以来,国内大规模预训练模型赛道有多笔大额融资,单笔融资金额高达 10 亿元,投资机构包括联想创投、君联资本、启明创投、创新工场等。
那么,被网友玩坏的 ChatGPT 究竟是什么?其背后的大规模预训练模型是怎样的赛道,为何受众多投资机构追捧?融资热背后,距离真正大规模商用落地还有多远?
AI 如何攻破人类,发人深省的回答
简单来说,预训练模型是前人解决问题所创造的模型。后人解决类似问题时,无需从零开始训练新模型,可利用此前训练过的模型。与常见语音助手不同,ChatGPT 能理解复杂语句内容,如多层语法嵌套的句子,还拥有联系上下文理解语境的能力,能围绕话题与人类展开讨论。它既能承认错误、质疑不正确前提,还能拒绝不恰当请求。
OpenAI 官方称,ChatGPT 是在人类帮助下创建并训练的,人类训练师对 AI 早期版本回答查询的方式进行排名和评级,这些信息反馈到系统中,系统根据训练师偏好调整答案,此为强化学习。据国盛证券研报,ChatGPT 有多达 1750 亿个模型参数,OpenAI 主要使用的公共爬虫数据集是超万亿单词的人类语言数据集。该研报指出,ChatGPT 在寻找答案、解决问题效率上已部分超越如今的搜索引擎,未来可能改变我们获取信息、输出内容的方式,AIGC 有望成为数字经济时代驱动需求爆发的杀手级应用。
不过,ChatGPT 并非无所不知。官网显示,它存在一些局限性,如有时给出看似正确但荒谬的答案、微调提问方式会得到不同答案、有时反复使用某些句子等。网友也发现其输入不能有错、解释不够人性化的缺点,因此它被编程问答社区 Stack Overflow 封禁。目前,ChatGPT 研究团队表示将根据用户反馈持续改进模型,未来仍有很长路要走。
尽管如此,OpenAI 仍被视为全球 AI 领域顶级机构。其 2020 年推出的上一代 GPT- 3 被视为人工智能领域重要里程碑,之后 OpenAI 尝试对 GPT- 3 商业化,以 API 形式向开发者客户有偿提供模型并按 token 使用量收费,基于 GPT- 3 产生的 App 已达 300 多个。今年大火的 AI 绘画也与 OpenAI 密切相关,它曾推出 DALL- E 低代码工具,用户输入想法和参数就能生成艺术画作,这波热潮中还涌现了 Midjourney、Stable AI 等独角兽初创公司。2019 年,微软向 OpenAI 投资 10 亿美元,为微软云战略吸引了不少客户,如美国最大汽车零售平台 CarMax 利用 OpenAI 开发工具分析客户评论,人工编辑团队完成此项工作需 11 年。
融资火热背后,离真正大规模商用还有多远?
近两年,国内掀起“大练模型”和“练大模型”热潮,行业巨头和高校科研机构纷纷参与。百度发布产业级知识增强大模型“文心”(参数规模达 2600 亿),华为联合鹏程实验室等发布“盘古”大模型,阿里巴巴达摩院发布中文语言模型 PLUG,北京智源人工智能研究院牵头研发的“悟道”(悟道 2.0 参数规模达 1.75 万亿)于 2021 年亮相。
联想集团副总裁、联想创投集团高级合伙人宋春雨表示,AI 预训练大模型的出现,成为近三年来 AI 算法创新最受关注的投资机会。随着超大规模 AI 预训练模型技术突破,在自然语言理解方面展现出高可用性,即“机器真的懂人了”。他认为,大规模预训练模型是 AI 大数据发展的必然之路,未来两年到三年,AI 能力将大幅提升。
启明创投合伙人周志峰也表示,人工智能过去 10 年发展集中在感知智能,特别是视觉和语音技术突破。下一个十年将走向认知智能,预训练大模型是核心技术推动力和关键基础设施,让 AI 吸收更多知识去理解和思考,实现接近人类水平的认知,同时使 AI 从依赖手工调参建模走向可大规模复制的工业化阶段。
大规模预训练模型受投资人看好,直接反映在投融资热度上。睿兽分析显示,2022 年以来,尤其是下半年,该领域出现多笔大额融资。2 月 10 日,澜舟科技完成近亿元 Pre- A 轮融资,由联想创投、斯道资本共同领投,创新工场跟投。9 月 26 日,智谱 AI 宣布获得数亿元 B 轮融资,由君联资本和启明创投联合领投。11 月 7 日,小冰公司宣布完成 10 亿元新融资。12 月 6 日,聆心智能完成数千万元天使 + 轮融资,由连星资本领投,图灵创投和智谱 AI 跟投。
这些企业均将商业落地作为融资后发力重点,但侧重点不同。澜舟科技研发的“孟子”模型,用较小模型规模(10 亿参数量)实现比肩超大模型的性能,具备灵活领域和场景适应能力,利于在机器翻译、文本生成、行业搜索等场景快速、低成本落地。2021 年 9 月,澜舟科技和传神合作的第一个基于孟子预训练模型的“任度”翻译引擎正式发布上线,截至目前已完成各行业垂直领域 20 余个翻译模型开发,覆盖新闻、金融、汽车等领域。
聆心智能主要侧重于游戏、营销、情感三个领域。12 月推出图灵世界首个产品“AI 乌托邦”,用户可快速定制 AI 角色,输入简单描述就能召唤相应人设的 AI 并与之深度对话、命令其完成任务。此外,还打造了 Emohaa 情绪疗愈机器人,与精神心理平台好心情合作,落地国内首款人工智能心理陪伴数字人;与高端豪华电动车品牌 Beyonca 合作,打造新一代智能驾舱助手。
新一轮融资公布当天,小冰公司启动对旗下人工智能数字员工(AI Being Employee)产品线的年度升级,加强大模型对话引擎。据悉,目前小冰框架中运行了 30 万名数字员工,包括万科集团年度优秀员工“崔筱盼”、红杉中国首位虚拟分析师“Hóng”、虚拟歌手“洛天依”等。由小冰框架生成的“小堂妹”等数名虚拟主播,全网播放量均已破亿。
尽管各家“大炼模型”在商业落地上取得一些成绩,但实际应用情况及能解决的实际问题仍遭用户质疑。平安科技前沿技术部门负责人王磊曾公开指出,当前大规模预训练模型在垂直领域存在“致命”问题。他认为,原因可能是大规模预训练模型训练语料库规模大,包含关键信息和无关信息,使模型缺少对关键信息的关注,且当前模型机制改进很少涉及对关键信息的提取。
不同于网友在 ChatGPT 上的“自娱自乐”,大规模预训练模型一旦商用,若出现错误,可能造成难以挽回的实际损失,这也是客户最大的担心。特别是金融行业客户对上线模型精度要求高,不少场景直接使用预加载模型难以满足需求。有投资人表示,“尽管可通过置信度评估方法等提升模型靠谱程度,但距离商用真正意义上的‘好用’仍有很长路要走。”