ChatGPT爆火背后：资本追逐与大规模商用前景

199次阅读

共计 2887 个字符，预计需要花费 8 分钟才能阅读完成。

近日，一个叫 ChatGPT 的聊天机器人彻底出圈，在网络上掀起热潮。它能编写代码、修复漏洞，还能撰写工作周报、创作小说、进行高考答题，甚至能被诱导规划毁灭人类的方法。尽管市面上已有众多聊天机器人，马斯克仍感叹：“很多人疯狂陷入 ChatGPT 循环，我们离强大到危险的人工智能不远了。”

ChatGPT 是美国 OpenAI 开发的大规模预训练语言模型，马斯克曾是该公司创始人之一。12 月 5 日，OpenAI 首席执行官 Sam Altman 在社交媒体发文称，ChatGPT 上周三推出，截至目前已突破 100 万用户，免费公测版本的服务器很快被热情用户挤爆。

联想集团副总裁、联想创投集团高级合伙人宋春雨表示，AI 预训练大模型的出现，成为近三年来 AI 算法创新最受关注的投资机会。睿兽分析显示，2022 年以来，国内大规模预训练模型赛道有多笔大额融资，单笔融资金额高达 10 亿元，投资机构包括联想创投、君联资本、启明创投、创新工场等。

那么，被网友玩坏的 ChatGPT 究竟是什么？其背后的大规模预训练模型是怎样的赛道，为何受众多投资机构追捧？融资热背后，距离真正大规模商用落地还有多远？

简单来说，预训练模型是前人解决问题所创造的模型。后人解决类似问题时，无需从零开始训练新模型，可利用此前训练过的模型。与常见语音助手不同，ChatGPT 能理解复杂语句内容，如多层语法嵌套的句子，还拥有联系上下文理解语境的能力，能围绕话题与人类展开讨论。它既能承认错误、质疑不正确前提，还能拒绝不恰当请求。

OpenAI 官方称，ChatGPT 是在人类帮助下创建并训练的，人类训练师对 AI 早期版本回答查询的方式进行排名和评级，这些信息反馈到系统中，系统根据训练师偏好调整答案，此为强化学习。据国盛证券研报，ChatGPT 有多达 1750 亿个模型参数，OpenAI 主要使用的公共爬虫数据集是超万亿单词的人类语言数据集。该研报指出，ChatGPT 在寻找答案、解决问题效率上已部分超越如今的搜索引擎，未来可能改变我们获取信息、输出内容的方式，AIGC 有望成为数字经济时代驱动需求爆发的杀手级应用。

不过，ChatGPT 并非无所不知。官网显示，它存在一些局限性，如有时给出看似正确但荒谬的答案、微调提问方式会得到不同答案、有时反复使用某些句子等。网友也发现其输入不能有错、解释不够人性化的缺点，因此它被编程问答社区 Stack Overflow 封禁。目前，ChatGPT 研究团队表示将根据用户反馈持续改进模型，未来仍有很长路要走。

尽管如此，OpenAI 仍被视为全球 AI 领域顶级机构。其 2020 年推出的上一代 GPT- 3 被视为人工智能领域重要里程碑，之后 OpenAI 尝试对 GPT- 3 商业化，以 API 形式向开发者客户有偿提供模型并按 token 使用量收费，基于 GPT- 3 产生的 App 已达 300 多个。今年大火的 AI 绘画也与 OpenAI 密切相关，它曾推出 DALL- E 低代码工具，用户输入想法和参数就能生成艺术画作，这波热潮中还涌现了 Midjourney、Stable AI 等独角兽初创公司。2019 年，微软向 OpenAI 投资 10 亿美元，为微软云战略吸引了不少客户，如美国最大汽车零售平台 CarMax 利用 OpenAI 开发工具分析客户评论，人工编辑团队完成此项工作需 11 年。

近两年，国内掀起“大练模型”和“练大模型”热潮，行业巨头和高校科研机构纷纷参与。百度发布产业级知识增强大模型“文心”（参数规模达 2600 亿），华为联合鹏程实验室等发布“盘古”大模型，阿里巴巴达摩院发布中文语言模型 PLUG，北京智源人工智能研究院牵头研发的“悟道”（悟道 2.0 参数规模达 1.75 万亿）于 2021 年亮相。

联想集团副总裁、联想创投集团高级合伙人宋春雨表示，AI 预训练大模型的出现，成为近三年来 AI 算法创新最受关注的投资机会。随着超大规模 AI 预训练模型技术突破，在自然语言理解方面展现出高可用性，即“机器真的懂人了”。他认为，大规模预训练模型是 AI 大数据发展的必然之路，未来两年到三年，AI 能力将大幅提升。

启明创投合伙人周志峰也表示，人工智能过去 10 年发展集中在感知智能，特别是视觉和语音技术突破。下一个十年将走向认知智能，预训练大模型是核心技术推动力和关键基础设施，让 AI 吸收更多知识去理解和思考，实现接近人类水平的认知，同时使 AI 从依赖手工调参建模走向可大规模复制的工业化阶段。

大规模预训练模型受投资人看好，直接反映在投融资热度上。睿兽分析显示，2022 年以来，尤其是下半年，该领域出现多笔大额融资。2 月 10 日，澜舟科技完成近亿元 Pre- A 轮融资，由联想创投、斯道资本共同领投，创新工场跟投。9 月 26 日，智谱 AI 宣布获得数亿元 B 轮融资，由君联资本和启明创投联合领投。11 月 7 日，小冰公司宣布完成 10 亿元新融资。12 月 6 日，聆心智能完成数千万元天使 + 轮融资，由连星资本领投，图灵创投和智谱 AI 跟投。

这些企业均将商业落地作为融资后发力重点，但侧重点不同。澜舟科技研发的“孟子”模型，用较小模型规模（10 亿参数量）实现比肩超大模型的性能，具备灵活领域和场景适应能力，利于在机器翻译、文本生成、行业搜索等场景快速、低成本落地。2021 年 9 月，澜舟科技和传神合作的第一个基于孟子预训练模型的“任度”翻译引擎正式发布上线，截至目前已完成各行业垂直领域 20 余个翻译模型开发，覆盖新闻、金融、汽车等领域。

聆心智能主要侧重于游戏、营销、情感三个领域。12 月推出图灵世界首个产品“AI 乌托邦”，用户可快速定制 AI 角色，输入简单描述就能召唤相应人设的 AI 并与之深度对话、命令其完成任务。此外，还打造了 Emohaa 情绪疗愈机器人，与精神心理平台好心情合作，落地国内首款人工智能心理陪伴数字人；与高端豪华电动车品牌 Beyonca 合作，打造新一代智能驾舱助手。

新一轮融资公布当天，小冰公司启动对旗下人工智能数字员工（AI Being Employee）产品线的年度升级，加强大模型对话引擎。据悉，目前小冰框架中运行了 30 万名数字员工，包括万科集团年度优秀员工“崔筱盼”、红杉中国首位虚拟分析师“Hóng”、虚拟歌手“洛天依”等。由小冰框架生成的“小堂妹”等数名虚拟主播，全网播放量均已破亿。

尽管各家“大炼模型”在商业落地上取得一些成绩，但实际应用情况及能解决的实际问题仍遭用户质疑。平安科技前沿技术部门负责人王磊曾公开指出，当前大规模预训练模型在垂直领域存在“致命”问题。他认为，原因可能是大规模预训练模型训练语料库规模大，包含关键信息和无关信息，使模型缺少对关键信息的关注，且当前模型机制改进很少涉及对关键信息的提取。

不同于网友在 ChatGPT 上的“自娱自乐”，大规模预训练模型一旦商用，若出现错误，可能造成难以挽回的实际损失，这也是客户最大的担心。特别是金融行业客户对上线模型精度要求高，不少场景直接使用预加载模型难以满足需求。有投资人表示，“尽管可通过置信度评估方法等提升模型靠谱程度，但距离商用真正意义上的‘好用’仍有很长路要走。”

正文完