日本全力押注主权AI,多国纷纷入局

16次阅读

共计 5151 个字符,预计需要花费 13 分钟才能阅读完成。

6 月 14 日,由谷歌知名研究者 David Ha 和 AI 开创性论文作者之一 Llion Jones 建立的 SakanaAI 宣布完成 1.27 亿美元融资,由 Khosla Ventures、Lux Capital、NEA 联合领投。该公司成立于 2023 年 7 月,近半年融资 2 轮,上轮资方还包括 NTT 及索尼等。据《朝日新闻》报道,SakanaAI 在新一轮融资后估值约为 1800 亿日元(11.42 亿美元),成为日本增长速度最快的 AI 独角兽。

“ 每个国家都需要占有自己的智力生产,这就是为什么会有 ‘ 主权人工智能 ’ 这个概念。它编撰了你的文化、社会智慧、常识、历史,因此你必须拿到这些数据、完善这些数据,并拥有自己的国家情报,你不能容许其他人这么做。” 黄仁勋在 2 月的 World Government Summit 提到了主权 AI。再小的国家如果要专注一项人工智能,那么第一件事是建立 “ 基础设施 ”,将自己的文化、语言编入自己的大语言模型中。

这个道理对 All in AI 的日本而言是字字箴言,2023 年他们举全国之力抢跑 AI 赛道,各大名企训练 AI 模型,巨额押注 “ 梦之队 &SakanaAI,旨在超越中美。不仅是日本,新加坡、印度、阿联酋等国也在大力投资主权 AI。

SakanaAI 被称作 “ 东京 AI 梦之队 ”,有着知名行业人才和新颖的创业理念。更为重要的是,他们是一家 100% 在日本注册的公司。SakanaAI 的名字取自日文 “ 鱼 ” 的意思,他们的 logo 是一簇鱼群,他们旨在开发基于自然原理的人工智能,即许多小元素共同作用以产生大结果。

3 月,SakanaAI 宣布发布 EvoLLM-JP(大语言模型)、EvoVLM-JP(视觉语言模型)和 EvoSDXL-JP(图像生成模型)这 3 种日语模型,后 2 者在 Huggingface 上可以在线试跑。从热度来看,3 类模型下载次数均未超 1000 次。从实效来看,模型的生成能力还带提升。作者使用其 EvoSDXL-JP 演示模型以日文 “ 大和抚子 ” 跑图后发现,生成图像仍存在物种、性别上的错误,及眼睛和腿脚显示的误差。在食物生成方面,模型生成效果好一些,更具美术效果。但模型生图速度很快,约为 5s/ 张,符合其推理仅需 4 步,速度比现有日本模型快 10 倍的说法,生图风格贴近题词 “ 日本浮世绘 ”。

短短几月达到成效,SakanaAI 团队游刃有余。6 月,他们开始研究起新问题:“ 我们是否也可以使用 LLM 来提出更好的算法来训练 LLM 本身 ”,如果可以,这是最少人工干预的情况下优化新算法的办法。他们将与牛津大学和剑桥大学合作这个项目。

SakanaAI 能吸引到多种学界资源并不意外,它于 2023 年 7 月在东京成立,创始人是 David Ha、Llion Jones 和后期加入的 Ren Ito,这三人都是业界知名人士。David Ha 是东京大学多学科博士,曾在高盛工作 8 年,成为 Google Brain 日本分中心的研究负责人,也是 Google 在职 6 年的研究科学家。他发布了多篇关于神经网络、深度学习、图像生成、项目演示和论文,并在 ACM、ICCV、ICLR、AAAI 等顶会 / 顶刊发表。早在 2018 年他就有一篇与日本古典文学深度学习相关的论文发表于 NeurIPS。David 曾担任 Stability AI 的研究主管,但不到 1 年确认离职,同时期 Stability AI 高层变动,其时任 COO Ren Ito 也同时离职,目前两人都在 SakanaAI 工作。他透露在日本创业的部分原因,一是日本尚未开发出有竞争力的大模型。二是在硅谷创业难以实现差异化。

SakanaAI 的 COO Ren Ito 毕业于东大,是纽约大学的法学硕士及法学院高级研究员、斯坦福的文学硕士。他最先是在政界任职外交官,曾是日本外务省首席副主任,后在商界也有成就,助日本二手平台 Mercari 策划 IPO,后前往 Stability 工作。在 Stability,他接触到了人工智能模型生成的西方凝视和文化偏见,Ren Ito 认为每种文化、每个民族、每个国家都应该建立自己的基础模型。在日本运营 SakanaAI,也算是 Ren Ito 得偿所愿。

另一位 Llion Jones 是 “Transformer 八子 ” 的其中之一,他毕业于伯明翰大学,在 YouTube、Google 工作过,直到去年才开始创立公司。他是人工智能界有开创性贡献的论文《Attention Is All You Need》的第五作者(每名作者同等重要),该文介绍的 Transformer 深度学习架构,成为 ChatGPT 等产品开发的基础。在知名 AI 人才不过百余人的当下,Llion Jones 坐镇 SakanaAI 显得意义非凡。

据 IT Media,SakanaAI 在 1 月融资后公布过一份创始成员名单,其中的 Google 含量极高,10 个人里 5 个来自 Google 的主要 AI 研究机构,有 3 名来自 Stability。David 在访谈中表示,今年 2 月他们在网上发布招聘信息的 4 天内收到 300 分申请,有 70% 来自英国、美国、澳大利亚等非日本地区。

团队阵容华丽,因此他们成立的第 7 个月就拿到了 3000 万美元的融资,估值达到 2 亿美元。SakanaAI 在 2024 年 1 月获得一轮资金,除了硅谷 VC Lux Capital 和 Khosla Ventures 外,还有日本的 NTT 集团、KDDI、索尼集团及 JAFCO 集团,还包括谷歌首席人工智能官 Jeff Dean、Hugging Face 创始人 Clem DeLang、Scale AI 创始人 Alex Wang 的个人投资。那时,他们的模型还在研发阶段,甚至还是一个概念。

Ren Ito 介绍,他们在开发一条生成式 AI 的创新之路,用 “ 自然启发智能 ” 的理念来实现低成本、强性能。“ 想象一个蜜蜂群,工蜂离开蜂巢寻找资源,他们可以相互交流优质资源的位置,优化资源利用。” 团队给出的专业解释是,他们的算法可以通过在组合、测试和丢弃数据时模仿自然选择,帮助自动创建处理语言或图像的 AI 模型,减少人工输入量。他们跟 OpenAI 花数十亿美元的训练方法形成鲜明对比,David 设想的是,“ 我们希望用更少的计算将时间缩短到几天或几周,同时获得相似的性能水平。” 官网称,他们使用 “ 进化模型合并 ” 来开发兼具性能指标和稳健性的大模型。

第一个好处便是节省算力。Medium 用户 Bragi 分析,“ 模型合并 ” 即通过结合多个小模型的知识和能力来创建高性能模型,计算成本仅是小部分。最终生成的统一模型可以达到或超过几个大模型的性能。另外,这个过程类似于多个开源模型融合,类似自然进化繁衍出下一代优秀模型,无需人工干预,且能青出于蓝胜于蓝。进化模型合并有效地自动化模型构建,不仅适用于语言生成,也适用于图像生成。如他们的 EvoSDXL-JP 的构建,由日语专用图像生成模型合并英语基本图像生成模型得到兼容日语的图像生成模型(对应表中模型 6),再将其与更快的生图模型合并,由此得到支持日语的高速图像生成模型 EvoSDXL-JP(对应表中模型 7)。

SakanaAI 极速开发、降本增效的方法论与日本渴望的速度契合。在其发布 3 个大模型后,又一笔新的融资快速启动。即使在 3 月,Sakana AI 初期的合并模型效果不佳,日本政府和商界选择持续投入。在 4 月时,SakanaAI 是日本工业部 “ 生成式 AI 加速器挑战赛 ” 七家获得赠款的实验室之一,并赢得了日本政府提供的超级计算机使用权资助,并与 NTT 和索尼等巨头公司合作,建设日本人工智能的生态系统。此外,SakanaAI 还瞄准了政府机构工作及国防工业的分包合同。

“(日本)公司应该至少该拥有自己的基础模型,即使这个模型的性能并不是特别好,”David 开玩笑说道,“ 他们需要拥有属于自己的传真机。” 据 Crunchbase,Sakana AI 在 6 月完成由 Lux Capital、NEA、Khosla Ventures 联合领投 200 亿日元(约 1.43 亿美元)融资,投后估值约 11.5 亿美元。也正是因为这笔融资,Sakana AI 没有明确的核心产品,却成为新兴独角兽。

SakanaAI 是日本打造本土大模型的晋级之路上选择的 “ 明星战队 ”,在其举国之力发展 AI 时备受瞩目,获得满满的期待和诚意。

不仅仅是日本,世界各国都在对主权 AI 做出投资。中美创企和巨头在大模型上 “ 卷生卷死 ”。中国研发的大模型数量全球第二,“ 你领跑,我紧追 ” 的态势已经不用多说,国家是人工智能发展的有力支撑。有外媒报道称,一些国家自认为在移动互联网和云计算革命中落后的国家,在此次 AI 浪潮中要设法保全本土文化与国家安全。现任新美国安全中心的 Pablo Chavez 表示:“ 一些国家政府对生成式 AI 革命将如何影响经济感到万分焦虑 ”。这份焦虑正击中了各国政府的痛点,而唯有行动能战胜焦虑。

亚洲范围内,今年 4 月,韩国、日本政府纷纷出台政策投资 AI 领域。韩国的投入金额不少,约为 9.4 万亿韩元(69.4 亿美元),支持其成为半导体供应大国的目标。韩企巨头们早早就研发了大模型,除了上述 Naver 的 Hyper CLOVA,还有 LG 的 Exaone,KT 的 Mi:DEUM(韩企开发的首个 LLM)等,韩国大型电商、云服务企业与 AI 芯片公司合作共同参与政府项目。

新加坡是主权 AI 的投资大户,也是英伟达的大买家。英伟达 2023 年第三季度业绩指出,约 15%(27 亿美元)收入来自新加坡,这与其本身具有多个数据中心和云服务提供商有关。据 Crunchbase 数据,东南亚 AI、机器学习、数据等相关业务公司约 1354 家,其中有 866 家都位于新加坡。政策方面,新加坡在去年 12 月出台政策 NAIS2.0,要在未来投资超 10 亿美元用于 AI 计算、人才和行业发展。而且,新加坡计划要率先建一个基于东南亚语言训练的 LLM。

眼光转向电力基础设施相对落后的印度。据数据,印度 AI 大模型领域的公司还不到 10 家,独角兽 Krutrim 的自研模型仅允许 400 多个字符输入。印度政府在 3 月直接批准了国家级 “IndiaAI” 项目,投入 1030 亿卢比(12.4 亿美元)旨在实现 “ 让 AI 为印度服务 ” 的目标,受主权 AI 的概念推动,希望建立一个全面的生态系统。

中东土豪选择砸钱搞先进科技。阿联酋成立 AI 和先进技术委员会(AIATC),今年 3 月 AIATC 宣布成立投资公司 MGX,由穆巴达拉和 G42 共同合伙部署前沿技术,投资集中在人工智能基础设施、半导体和人工智能应用 3 个领域,据称资产规模在未来几年超 1000 亿美元。沙特公共投资基金(PIF)计划在 AI 领域投资 400 亿美元,希望支持一系列初创、芯片企业和庞大的数据中心,甚至是沙特自己创办人工智能公司。

肯尼亚在 5 月和 G42 签了一份协议,在该国斥资 10 亿美元建一个数据中心,以肯尼亚的地热能(供电)用斯瓦西里语和英语训练一个 AI 模型。不缺 AI 人才的加拿大在 4 月投入了 24 亿加元(约 17.7 亿美元),20 亿提算力建基础设施,剩下的资金赋能初创和研发。一揽子发展 AI 的计划推出,确保加拿大人工智能优势地位。

另一边,欧洲的人工智能也在暗暗较劲。线性资本投资者黄松延在访谈中表示,欧洲是很多原创性技术的发源地,AI 和机器学习领域的不少大牛藏在欧洲各个角落不为人知。如法国版 OpenAI Mistral 就在巴黎造出 Mistral Large,推理任务不逊色 GPT-4。今年 4 月,欧盟委员会宣布将在人工智能领域投资 6500 多万欧元,其中有 5000 万用于扩展大模型能力。法国、德国和意大利都在发力,法国总统马克龙呼吁欧洲建立政府和社会资本合作买芯片,到 2030 年或 2035 年将欧洲全球 GPU 部署份额从 3% 提升到 20%。

总的来看,各国政府、企业投资本地语言的模型、算力和数据中心,以免发展先进 AI 技术受制于他国。模型较弱的国家在造地基,而已有强力模型的国家则在构筑 “ 护城河 ” 巩固地位。

这其中,赚钱的人将主权 AI 的概念变成了产品的 USP。近半年,黄仁勋既参加了阿联酋的 WGS,又在去年 9 月会见了印度总理莫迪,12 月与日本首相和新加坡总理会面,推动政府或政府关联单位、计算机基础设施电信公司投资 AI。实际上,主权 AI 从商人黄仁勋口中说出时,便带有盈利性质。早在 2019 年,英伟达就有一项 “AI Nations” 计划帮助各国建立主权 AI,包括生态系统支持和劳动力发展。各国政府砸钱新建数据中心,用专门的计算机芯片改造旧数据中心,这类芯片大多来自英伟达。

据《华尔街日报》,英伟达在 5 月表示,主权 AI 战略预计将在今年带来近 100 亿美元的收入,去年还是一片空白。英伟达公布的季度收入是 260 亿美元,其中近一半来自使用其芯片的大型云计算公司。CFRA 的分析师 Angelo Zino 得出结论:“(英伟达)面向云计算的销售额显然无法持续攀升,但它能通过其他方式从 AI 热潮中获利。创造更高收入,主权 AI 正是一个新的收入增长点。”

正文完
 0