共计 3304 个字符,预计需要花费 9 分钟才能阅读完成。
在文心一言发布的前一日,百度创始人李彦宏向其询问对 GPT4 的看法。文心一言作为百度在知识增强大语言模型方面的最新成果,对标美国 OpenAI 公司的 ChatGPT。过去三个月,ChatGPT 备受全球互联网关注,就在百度发布文心一言前一天,ChatGPT 推出了支持图像输入等多模态模型的 GPT4 版本。李彦宏在文心一言新闻发布会上承认其存在不足,但强调文心一言是全球首个由互联网大厂正式发布的产品。
实际上,ChatGPT 和文心一言的大语言模型产品都存在一些不完美之处。ChatGPT 自 2022 年 11 月发布后,常被诟病喜欢编造事实和论据,直到 GPT4 发布,这一问题才有所改善。百度文心一言的诞生,意味着中国市场有了本土大语言模型产品。百度成为国内第一家真正发布大语言模型的互联网公司,文心一言也因此被拿来与微软产品中广泛应用的 ChatGPT 作比较,二者被视为中美互联网大厂竞争的代表。
尽管文心一言存在“不完美”,但对于“你怎么看 GPT4”这个问题,它给出的答案让李彦宏较为满意。文心一言凭借叠加在大语言模型之上的知识增强和检索增强能力,对 GPT4 进行了及时总结。李彦宏表示未来在这方面还会不断进步。
文心一言发布时,李彦宏重点展示了其具备的文学创作、商业文案创作、数理推算、中文理解和多模态生产等大模型语言通用的五种能力。例如,续写《三体》、做鸡鸭同笼数学题、写藏头诗、创作海报等功能在文心一言中均可实现。
在文学创作和商业文案创作方面,文心一言的表现体现了其内容创作生成能力。这需要对大模型语言进行总结分析,并借助知识增强提高事实性准确率,从而实现准确流畅的回答和清晰的输出表达。有人对文心一言和 ChatGPT 进行了测试,将问题抛给文心一言,询问它对 ChatGPT 的看法,文心一言回答逻辑清晰,列出了五个问题涉及的方向。在关于人工智能语言模型如何理解人类情感和沟通方式的问题上,文心一言和 ChatGPT 生成的内容相似,都是二者普遍关注的问题。将同样的问题抛给基于 ChatGPT4 的微软浏览器 New Bing,得到的回答也是五个问题,且二者回答速度相近,都展现出了思维和逻辑分析能力,只是 ChatGPT4 的内容相对简单,可能是因为文心一言刚发布,内容量较少。
事实上,相较于用户感知到的文心一言生成内容,其底层技术逻辑系统更为重要,这是文心一言不断迭代进化的基础。文心一言的大语言模型改变了 IT 技术栈,将过去的三层分级变为芯片层、框架层、模型层和应用层,文心一言处于模型层。百度在这四层都有布局,李彦宏强调百度在全球范围内是为数不多在每一层都有突出产品的公司。
自 2019 年 3 月推出文心 ERNIE1.0 以来,经过多次迭代,在底层技术的支撑下,文心一言的大模型不断进化,四层形成高效反馈闭环,助力大模型越做越好。如今,ERNIE 3.0 每天接受数十亿次用户的搜索请求。
文心一言如同 ChatGPT 一样开启了进化之路,二者将在各自技术架构中不断优化并提升效率。从这个角度看,百度的文心一言作为本土化大语言模型值得期待,其更高效的模型需要不断升级,以满足用户日益丰富的场景需求。
在国内众多互联网大厂中,百度在人工智能领域涉足较早且布局体系完善。李彦宏一直对人工智能充满兴趣,早年在美国学习计算机科学时,他对人工智能课程的兴趣远超硬件相关课程,只是当时缺乏人工智能应用环境,他只好暂时搁置。随着计算机网络发展,尤其是互联网技术进步,李彦宏看到了希望。
从 2012 年成立深度学习研究院,到 2014 年提出搭建“百度大脑”,再到 2016 年将人工智能列为百度核心业务的核心,百度在人工智能领域的布局领先于国内厂商,带动了国内互联网公司成立人工智能实验室的热潮,促使人工智能科学家从学界向企业界转移。在李彦宏的判断下,百度不断完善体系,2017 年整合内部 AI 团队,形成百度 AI 技术平台体系(AIG),由王海峰任总负责人,旨在以新的组织形式释放百度人工智能的活力。
2019 年,王海峰成为百度 CTO,这是百度十年来首次进行集团 CTO 任命,外界认为这体现了百度 AI 战略落地、技术创新驱动产品创新加速的决心。同年,百度在自然语言处理领域取得先发优势,推出文心大模型 ERNIE 1.0,成为文心一言的技术基础。
从 2012 年的 23.05 亿研发投入,到 2021 年的 249.38 亿研发投入,近十年间百度在人工智能等领域的研发积累超过 1000 亿,连续 5 年在人工智能申请量和授权量上位居国内第一。
李彦宏在《智能革命》一书的序言中提到:“智能革命,其过程会轰轰烈烈,但成果将会是一条宽广平缓的河流。人工智能领域的权威人士认为,在不久的将来,智能流会像如今的电流一样平静地环绕、支持着我们,在各个环节提供养分,彻底改变人类经济、政治、社会、生活的形态。”
如今,文心一言的发布标志着百度站在了大语言模型的智能革命赛道上,也反映出互联网搜索赛道成为这场智能革命的风暴中心。在过去短短一个月内,超过 650 家合作伙伴宣布加入文心一言生态,这证明了大语言模型市场的旺盛需求。李彦宏认为,“AI 市场即将迎来爆发式需求增长,其商业价值的释放将是前所未有的、呈指数级的。”
李彦宏将基于大语言模型的应用开发比作基于安卓或 IOS 开发微信、淘宝、抖音等超级应用,他认为大语言模型将给全行业带来三大产业机会:第一类是新型云计算公司,其主流商业模式将从 IaaS 变为 MaaS;第二类是进行行业模型精调的公司,它们作为通用大模型和企业之间的中间层,凭借行业技术诀窍,调用通用大模型能力,为行业客户提供解决方案;第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。
多元开发平台的生态价值才是未来的关键。只有在开放逻辑下,拥有连接其他合作伙伴成果与产业环节的机会,大语言模型技术才能拥抱未来。
回顾过往,竞争格局的决定性瞬间在 2019 年就已确定。当年百度作为国内人工智能领导者推出文心大模型 ERNIE 1.0,与此同时,微软向 ChatGPT 的母公司 OpenAI 投资 10 亿美元,试图在云计算和人工智能领域超越亚马逊和谷歌。
如今,随着文心一言在国内发布,大语言模型的进化速度加快,中美科技界在大语言模型领域实现了交汇。李彦宏表示,一旦有了真实的人类反馈,文心一言的进步速度会很快,大家都期待它能早日为用户和客户创造价值。
在竞争的另一方,微软将 ChatGPT 背后的 AI 技术融入 Office 办公套件,并升级为 GPT4 技术后,ChatGPT 的记忆力提升了 10 倍,开启的视图功能进入多模态模式,通过律师考试等一系列考核验证了其逻辑思维能力的增强。
李彦宏在发布会最后特别强调:“文心一言不是中美科技对抗的工具。”这表明文心一言是百度技术人员追逐科技改变世界梦想的产物,是服务亿万用户、赋能千行百业的全新平台,是创新驱动发展的有力证明。这也变相回应了微软,微软已将百度视为对手,双方都在探索人工智能的不同可能性。
今年 2 月,微软副董事长布拉德·史密斯(Brad Smith)曾强调,通过负责任的 AI 推进未来,人工智能是这场竞争的下一个前沿领域。他将百度的人工智能研究院列为下一波人工智能浪潮中的第三大突出者,排在前面的分别是 Open AI 和微软的结合,以及谷歌内部的 Deep Mind。
无论如何,大语言模型的赛道已经形成,围绕它的竞赛正式拉开帷幕。对于参赛者而言,大规模语言的商用还有很长的路要走。人工智能技术从业者胖总表示:“有必须是前提,可能一开始不够好,但随着使用人数增加,生态体系完善,国内外差距会越来越小,甚至追平乃至超越。实践无数次证明,在把某一项技术玩出‘花’这点上,我们要充分相信中国企业的智慧。”
显然,人工智能系统正逐渐成为未来日常生活的一部分。AI 领域的大神杰弗里·辛顿(Geoffrey Everest Hinton)曾用一个精彩的中文比喻,将 GPT4 比作化茧成蝶,“毛毛虫提取养分,然后转化为蝴蝶。人们已经提取了数十亿块理解的金块,GPT4 是人类的蝴蝶。”从这个意义上说,百度和微软是当下的“蝴蝶”,虽身处不同地方,但都通过背后的 NLP(自然语言)技术和大语言模型,致力于从机器中提炼符合人类意图和价值观的成果。