红杉资本加持,Hugging Face如何打造AI开源创新高地?

21次阅读

共计 2738 个字符,预计需要花费 7 分钟才能阅读完成。

Hugging Face:AI 开源社区的领军者

Hugging Face 是一家估值约 20 亿美元的人工智能独角兽企业,背后拥有 24 位投资人,包括 Lux Capital 和红杉资本等知名资本。在大模型融资金额屡创新高的时代,Hugging Face 尽管估值相对较“温和”,却迅速成长为 AI 创造力的核心聚集地。

被誉为“AI 领域的 Github”,Hugging Face 建立了一个庞大的开源社区,汇聚了众多开发者和产品经理,共同研究和分享训练或微调的 AI 模型。目前其客户超过 5000 家,其中 3000 家为付费用户。社区中核心的力量之一是 Transformers 自然语言处理库,该库在 GitHub 上拥有超过 62000 颗星和 14000 个分叉,充分显示其技术的受欢迎程度和使用广度。

Transformers 提供的 API 让用户轻松使用和训练最先进的预训练模型,大大降低了计算成本,减少碳排放,同时节省了大规模模型训练的宝贵时间。除了这款明星产品,Hugging Face 还提供 Datasets(多模态模型数据集)、Hub(模型及数据托管)、Tokenizers(高速分词器)等一系列辅助工具,构筑了完整的 AI 生态体系。

极客出身的创始人:Clem Delangue 的成长轨迹

Hugging Face 的背后推手是出生于法国小镇 La Bassée、曾就读于都柏林大学的极客 Clem Delangue。少年时期因互联网的普及打开了视野,Clem 早早便展现出分享知识和开源的精神。他大学时创建的 UniShared 教育平台,旨在缓解全球教育资源分配不均,虽然未能大规模改变,但播下了开源精神的种子。

Clem 拒绝了谷歌的邀请,选择扎根初创环境,曾在巴黎的计算机视觉创业公司 Moodstocks 工作,首次深入接触机器学习。当他向 Apple 的市场专家 Guy Kawasaki 演示手机识别水瓶品牌并获取社交媒体评论时,机器学习连接人与人、打造新体验的潜力深深触动了他。

2016 年,Clem 在纽约与精英数学家兼好友 Julien Chaumond 及专利律师 Thomas Wolf 组成团队,他们决心打造一个开放领域的会话式 AI 聊天机器人——一个能够和人畅谈各种话题的人性化机器人。当时 NLP 依赖深度神经网络尚处于初期,技术挑战巨大,更需要庞大的数据管理和训练。种种不可能的困境,让 Hugging Face 诞生并逐渐成长为全球规模最大的开源 AI 社区。

开源策略成就行业分水岭

Hugging Face 坚定地拥抱开源,从一开始就注重社区力量的培育。其发布的自定义版 BERT 模型成为划时代的事件——谷歌 2018 年 10 月发布的 BERT 模型太复杂且仅限 Tensorflow 平台,而 Hugging Face 迅速用 PyTorch 实现了兼容版本,并开源在 GitHub,开放给所有开发者微调和改进。

红杉资本投资人 Pat Grady 称这是让 Hugging Face 在自然语言处理圈成为英雄的关键时刻。Delangue 对开源的信念直接且真诚:“这是很多人想用的东西。”他强调,AI 的进步离不开开放科学与开源的支持,比如谷歌分享的《Attention Is All You Need》和 BERT 论文为整个 AI 领域的加速发展打下基础。

Hugging Face 进一步塑造了围绕 Transformer 模型的生态,提供约 20 万个公开模型。其团队不仅专注技术创新,也专注于构建一个共享知识、相互协作的社区,鼓励每个员工积极参与对外交流和支持用户,而不是单纯依赖社区经理。

狂欢派对般的社区力量

Hugging Face 的社区活动在业界已成标杆。2023 年 3 月,创始人 Clem Delangue 通过推特号召举办用户聚会,短时间内吸引超过 400 人报名,最终举办吸引了约 5000 名参与者。这场盛会被称作“AI 的伍德斯托克”,展现出 AI 领域的热情与创造力,汇聚了大量 AI 公司及开源项目,气氛既像狂欢节也像机器人竞技。

Delangue 在活动中着黄色紧身衣和 Hugging Face 表情符号吉祥物共舞,感慨开源带来的力量:“我们所处的 AI 位置,全归功于开放科学与开源。”社区的规模不仅推动了 Hugging Face 的持续发展,也使其成为诸如视觉大模型 Stable Diffusion 等顶尖项目的首选合作平台。

AI 创业新生态与未来展望

人工智能正以前所未有的速度发展。大语言模型从辅助短信息回复的后台技术,演化成可以生成图像、进行复杂对话的多功能工具,ChatGPT 成为历史上增长最快的应用之一。亿万开发者和产品经理涌入 AI 领域,彻底改变了这个曾经只属于博士和专家的世界。

Clem Delangue 认为,参与 AI 未来的人必须加入到像 Hugging Face 这样的社区,否则风险和误解会随之增加。他认同 AI 是“Software 2.0”这一观点,AI 作为新技术范式,尽管不万能且非人类意识体,但潜力巨大,将重塑经济和技术体系,规模超越互联网甚至传统软件。

关于通用大模型与开源小模型的选择,他指出,适用性取决于企业需求——大型科技公司可能更青睐通用模型,而消费品公司则需要更快、更经济且定制化的小模型。对于创业公司来说,起步阶段直接调用大模型 API 简便快速,但长远来看,如若不建立核心模型优化能力,难以实现差异化竞争。

拥有训练和微调模型能力的 AI 原生创业公司,正是颠覆传统企业的最大潜力者。他们能够提供更精准的定制解决方案,并在竞争中占据优势。

商业模式与融资理念

Hugging Face 采用经典的免费增值模式:基础功能免费,进阶功能收费。已聚集包括 Bloomberg 和 Grammarly 在内的 3000 个付费客户。当前公司最关注的是扩大平台的网络效应,让更多用户使用和依赖这一 AI 开放平台,随着用户基数增加,盈利潜力自然水到渠成。

Delangue 坦言,盈利应该看作分阶段逐步实现的目标。AI 领域技术变化快速,今天有效的商业模式可能 3 - 5 年后就需更新,持续学习和调整至关重要。

在融资方面,Delangue 秉持专注与深度原则:两轮融资之间不会分心与外界投资者交谈;融资时快速行动锁定合适的投资人,避免浪费时间;并会花三天时间与投资人深入了解,确保目标与价值观一致。他强调风险投资应该聚焦财务支持,而不是替创业者决策,否则容易带来管理冲突和资源分散。

Delangue 特别推崇 NLP 领域重量级专家 Richard Socher,称其在科学、商业和创业路径上给予巨大帮助。

总结

Hugging Face 凭借开源精神、扎实技术和强大社区,成为 AI 发展的重要枢纽。其创始人 Clem Delangue 的非典型创业路径和深刻见解,展现了 AI 产业生态的新范式。未来,随着 AI 不断渗透各行各业,像 Hugging Face 这样结合技术创新和社区力量的平台,将在塑造 AI 未来中扮演关键角色。

正文完
 0