共计 2258 个字符,预计需要花费 6 分钟才能阅读完成。
百度发布文心一言,与 ChatGPT 差距几何?
过去数月,ChatGPT 引发的热潮持续不断。众多国内公司及科技从业者,在对 ChatGPT 的出现感到兴奋之余,也满怀期待地盼望着中国能有自己的 ChatGPT。在众多宣称要推出类 ChatGPT 产品或大语言模型的公司中,百度是较早官宣且首个选择正式发布的。3 月 16 日,就在 GPT – 4 重磅升级两天后,百度于北京总部正式发布旗下大语言模型——文心一言。发布会上,百度创始人李彦宏展示了文心一言在文学创作、商业文案、数理逻辑推算、中文理解和多模态生成五个方面的能力。
由于生成式需输入较长文本和时间,不适合现场实机演示,所以选择用录屏形式展示文心一言的生成效果。这作为一场商业产品发布会,虽可理解,毕竟出错会严重影响外界看法和股价,谷歌此前推出生成式 AI 聊天机器人 Bard 时,就因一个“答非所问”的错误,市值蒸发了上千亿美元。但录屏的发布形式,还是让这场产品发布会显得有些空洞,毕竟没人清楚录屏背后有多少次尝试及人工痕迹,因此有人调侃百度发布了 ChatPPT。反映在股市上,文心一言不仅没抬升百度股价,发布后还一度跌超 10%。李彦宏在发布会上也提到,文心一言并不完美,但因市场有需求所以必须推出。然而,准备尚不充分的文心一言,是否选对了发布时间和节奏,目前仍未可知。即便如此,仍能从发布会内容中窥探文心一言的面貌,以及百度的野心与困境。
从发布会上的视频展示来看,文心一言面向大众用户的交互界面与 ChatGPT 基本相似,都以对话机器人形式回应用户的文本输入。但文心一言不像两天前发布的 GPT – 4 那样支持对图片信息的总结和分析,比如 OpenAI 将去年一张梗图输入并附上文字要求 GPT – 4 解释笑点,GPT – 4 能准确指出“梗”是“将过时的巨大 VGA 接口插入现代的小巧智能手机的反差”。不同的是,文心一言支持语音和视频输出。其“语音”支持只是通过 TTS 语音合成技术以四川话读出文本内容,不太突出,而“视频”生成难度明显更高。仅从录屏展示看,尽管模板痕迹明显,但生成视频(视频素材 + 字幕)起码还能用。
在具体文本理解和生成能力方面,百度在第一个“文学创作”环节展示了文心一言续写《三体》的创意能力,比如续写可从哪些角度出发。这些回答本身无所谓对错,但对比 ChatGPT 的回答能发现,文心一言的文本输出更“泛泛而谈”,ChatGPT 的输出则更具体。此外,百度在“商业文案”环节展示了用文心一言起公司名的情况,用同样问题询问 ChatGPT 会发现,若不强调中文名,ChatGPT 会自然倾向使用英文名。
OpenAI 在训练 GPT – 3.5 和 GPT – 4 大语言模型时,语料库、基准测试和开发人员都以英文为主,所以 ChatGPT 在英文的理解和生成能力胜过包括中文在内的其他语言。这也是百度的优势所在,百度或许更懂中文。尽管整体能力上,很难期待百度能瞬间超越 ChatGPT 和 OpenAI,但百度文心一言在中文信息的可靠性上可能有一定优势。除语言倾向问题外,ChatGPT 不论是 GPT – 3.5 还是 GPT – 4 版本,训练用语料库都截止于 2021 年 9 月,涉及很多未知信息时容易编造内容,比如介绍电视剧《三体》演员阵容时就“胡编乱造”。相较之下,百度文心一言和微软 Bing Chat 都正确指出了具体演员阵容,Bing Chat 还提醒了另一个 Netflix 版本的电视剧《三体》。发布会上,李彦宏表示,百度和文心一言更懂中文和中国市场,还单独在五个环节中设置了“中文理解”环节展示。以百度官方演示的“洛阳纸贵”为例,ChatGPT 再次出现“幻觉”,文心一言和 Bing Chat 基本指出了正确典故,接下来只有文心一言正面回答了“当时洛阳的纸到底有多贵”。当然,考虑百度选定的问题及录屏形式,还难以就此断定“文心一言在中文上比 ChatGPT(GPT – 3.5)更强”,但可以肯定的是,“中文”优势必定是百度乃至未来中国类 ChatGPT 产品发力的关键重点。
同时,百度也展示了自身在行业应用上的优势。李彦宏引用百度在人工智能上的四层架构——(AI)芯片层、(深度学习)框架层、模型层、应用层谈到,百度的多层架构协同效应将推动 AI 实现更快的迭代速度,在应用上也会有更高效率和成本。文心一言主要分为两部分,一部分面向普通用户,通过嵌入百度搜索,用户可直接与文心一言大语言模型交互,预计类似微软的 Bing 搜索和 Chat 的形式;另一部分面向企业客户,提供上述提到的四层人工智能全栈能力,从底层的云计算能力到深度学习框架,再到大模型和应用。事实上,百度比 OpenAI 更早开启 AI 大模型的商业化进程,在百度文心大模型的官网展示了与不同领域大公司合作开发的行业大模型,还宣布已有 650 家合作伙伴接入文心一言,包括之前官宣的魅族、携程、兴业银行、美通社等。但最终百度得在用户侧证明文心一言的表现实力,否则从合作伙伴到客户最终都会放弃百度。
ChatGPT 带来的突破,改变了搜索引擎的产品形态和业务模式,百度和谷歌都必须面对其带来的冲击和变革。百度和谷歌很早就率先拥抱 AI 技术,并在长达十年的时间里重金投入研发。百度在 2022 年将全年核心收入的 22.4%,即 214.16 亿元投入核心研发,谷歌在 2022 年更是投入 279 亿欧元研发经费,居全球第一。但在 ChatGPT 之前,庞大的研发积累一直没找到合适的商业化出口。ChatGPT 带来了出口和风口,当用户、开发者和企业客户都在拥抱 ChatGPT 时,百度不能放弃,就像李彦宏说的,文心一言没准备好却仍要发布,是因为有市场需求。