共计 2048 个字符,预计需要花费 6 分钟才能阅读完成。
又一位 AI 领域的杰出人物,投身于大模型的澎湃浪潮之中。据可靠消息,一家专注于 AI Infra(AI 架构)方向的新 AI 公司正在悄然筹备。尽管行事低调,但其在行业内已引发热烈关注,据悉已顺利获得首轮融资意向。
如此备受瞩目的创业项目,背后离不开关键人物——框架大神贾扬清。他在 AI 架构领域堪称华人中的佼佼者,不仅创建了知名深度学习框架 Caffe,还是 TensorFlow、Pytorch 的核心成员与共同领导者。此外,与他一同携手创业的,还有他多年并肩作战的战友,他们曾共同参与 ONNX、PyTorch 和 Caffe2 项目。
贾扬清此番计划创业的方向是成为 AI 基础设施提供商,聚焦于包括大模型在内的 AI 应用。具体而言,是要构建一个统一、多云且具备可观察性的人工智能平台。其目标是提升人工智能产品化的效率,涵盖开发者效率和系统效率两个方面,通过端到端的解决方案,助力企业和开发者高效部署人工智能,比如标准化的云 IaaS(基础设施即服务)平台、模块化的 AI 算法生命周期管理平台等。
回顾贾扬清的过往经历,便能发现此番创业方向早有迹可循。他在伯克利读博期间就创建了 Caffe 深度学习框架,之后成为 TensorFlow 的核心成员,以及 PyTorch 和 ONNX 的共同领导者。在阿里工作期间,他率领团队升级了以 ODPS 和 PAI 为代表的大数据和人工智能平台产品,满足了集团大数据存储、计算、分析和机器学习的需求,还支持发布了魔搭(ModelScope)开源模型社区。在 MEET2023 智能未来大会上,他谈到了人工智能高效应用和部署的关键要点,包括 AI 工程化和开源。工程化让开发、迭代到应用的路径更高效,开源则能使工作开展更迅速,实现市场共赢。在此基础上,他还阐述了 AI 产业应用的四个趋势:云原生的 AI 工程化平台;端到端优化的异构计算体系;通过系统组合打造贴近用户的智能产品;算法的开源助力 AI 在垂直产业的广泛应用。如今,这些趋势在他的创业项目中均有体现。
贾扬清来自浙江绍兴,父母皆是中学语文老师,然而他在初三便对编程产生兴趣并开始学习。高考时他考入清华,虽遗憾与计算机专业失之交臂,进入了自动化专业,但之后继续在清华完成控制科学与工程的硕士学位,随后赴 UC 伯克利攻读计算机博士。正是在读博期间,贾扬清完成了他的成名作——开源通用深度学习框架 Caffe。Caffe 的灵感源于 Cuda-Convnet,但其设计更具体系化、更抽象,同时拥有完整的单元测试。一经问世,便成为众多深度学习初学者的心头好,也被微软、雅虎、英伟达、Adobe 等大公司相继采用。
关于 Caffe 的开发过程,还有一段颇为有趣的故事。当时身为博士的贾扬清在购置设备方面颇为节俭,依靠英伟达捐赠的一块 K20 GPU,外加在亚马逊上花费 600 多元攒的一台电脑。据他本人后来透露,开发 Caffe 的另一个重要原因是不想写博士论文。给这个框架起名“Caffe”,也是因为在谷歌实习期间喝了太多咖啡想戒掉。由于 Caffe 的开发占用了大量时间,本该在当年 12 月完成的毕业论文推迟到了次年。不过,导师一直支持他的做法:“你是想多花时间写一个大家估计不会很在意的毕业论文呢,还是多花时间写一个将来大家都会用的系统?”后来的结果大家都已熟知。
Caffe 完成后不久,贾扬清顺利博士毕业并立即加入谷歌大脑,在 Jeff Dean 麾下担任研究科学家,进而打造出另一世界级代表作——作为核心作者参与创建 TensorFlow。两年后,贾扬清跳槽至 Facebook,在 AI 架构领域持续发力:先是参与开发了全球第一个部署在超过 10 亿手机上的深度学习引擎 Caffe2Go,随后很快推出了 Caffe2。接着,由他开创的中间机器学习框架 ONNX 的第一个版本发布。次年,在 Caffe2 以及 PyTorch 0.4 的基础上,并整合 ONNX 格式,PyTorch 1.0 诞生,贾扬清是该项目的共同负责人。在贾扬清之前,全球鲜有人能完成如此多个业内重磅架构的开发,在华人领域更是无人能及,堪称 AI 框架领域的第一华人。当然,在完成这一系列丰硕成果时,贾扬清已是 Facebook(现在的 Meta)AI 架构总监。但在 2019 年,他做出了一个重要决定:回到家乡浙江,入职阿里,35 岁便成为阿里技术副总裁,入职后主要领导大数据计算平台的研发工作。当时杜克大学陈怡然教授评价贾扬清的加盟,让阿里“开启‘一硬一软’两大学霸天王领导模式,在 AI 研究领域势如破竹”。
当下,AI 领域可谓风起云涌。昨日,创新工场 CEO 李开复宣布新公司 Project AI 2.0,围绕 AI 2.0 时代的平台及生产力应用生态,正式启动团队组建,在全球范围内招揽大模型、NLP、多模态、算法到分布式架构 /Infrastucture 等方向的人才。两周前,亚马逊首席科学家李沐也宣布离职,与其导师携手创办 Boson.ai,专攻面向大众的大模型。从全球范围来看,谷歌、Deepmind 一众工程师纷纷离职,围绕大模型的多个方向展开创业。由 ChatGPT 掀起的这波创业潮已然势不可挡。