共计 1403 个字符,预计需要花费 4 分钟才能阅读完成。
GPT- 4 的问世引发了全球科技界的广泛关注,然而,尽管其卓越性能令人震撼,OpenAI 并未披露太多技术细节。不过,在官方公布的贡献者名单中,我们可以一窥这款大型语言模型成功的幕后功臣。
从组织结构来看,GPT- 4 的研发团队大致分为七个部分,涵盖预训练、长上下文处理、视觉分析、强化学习与对齐、评估与分析、部署,以及额外支持。每个部分又进一步细分为多个具体任务,比如预训练组专注于计算机集群扩展、数据管理和硬件验证,而视觉组则侧重于架构优化、数据处理及模型安全。
多领域协作铸就突破
值得注意的是,GPT- 4 项目中的每位研究人员往往需要承担多项职责,这种跨职能的合作模式为模型的成功奠定了坚实基础。对于那些渴望追赶 ChatGPT 的科技企业而言,OpenAI 提供的这一组织架构模板无疑具有重要的借鉴意义。
自 ChatGPT 发布以来,OpenAI 在人才招募方面动作频频,吸引了众多来自谷歌和 Meta 的顶尖人才。截至 2023 年初,据相关数据显示,OpenAI 的员工总数超过 300 人,其中约有 59 人来自谷歌,34 人来自 Meta,另有若干人来自苹果和亚马逊。
华人学者的突出贡献
接下来,让我们聚焦几位代表性华人学者。Trevor Cai 是 GPT- 4 项目中吞吐量团队的核心领导者,他曾在 DeepMind 积累了丰富的经验;袁启明负责数据集的采集与处理,其职业生涯始于微软,后加入 OpenAI;Che Chang 则以副总法律顾问的身份参与到整个项目中,他不仅具备深厚的法学背景,还拥有丰富的技术法律事务处理经验。
欧阳龙不仅是 InstructGPT 论文的第一作者,还深度参与了 ChatGPT 相关技术的研发;Lilian Weng 作为人工智能应用研究的领军人物,主导了预训练、强化学习与模型安全等多个关键环节;Tao Xu 凭借扎实的学术功底和工业界实践,成为推动项目进展的关键人物之一。
视觉与强化学习领域的华人身影
在视觉组中,Mark Chen 和 Casey Chu 分别贡献了自己的专长,前者致力于图像理解,后者擅长多模态系统的设计。此外,胡绳丽的研究横跨多个领域,她在顶级会议上发表了多篇高影响力论文;Tianhao Zheng 则通过在多家知名企业的工作经历积累了宝贵经验,进而助力 GPT- 4 视觉模块的开发。
强化学习与对齐组同样汇聚了一批优秀人才,如 Chong Zhang、Shengjia Zhao 等,他们分别在谷歌、苹果、斯坦福等地积累了深厚的专业知识,并将其应用于 GPT- 4 的创新实践中。
评估与分析团队的亮点
评估与分析团队由多位资深专家组成,其中包括 Alvin Wang、Angela Jiang、Jason Wei 等人。Jason Wei 在加入 OpenAI 之前,已经在谷歌 Brain 取得了显著成就,特别是在思维链提示和指令调优方面有着开创性的贡献。
宋飏的研究方向涵盖了深度生成模型、概率推理及 AI 安全性等领域,他提出的扩散模型理论对现代生成式 AI 的发展产生了深远影响。
模型部署与 API 开发
在模型部署阶段,Michael Wu 和吴雪枫等人发挥了重要作用,他们不仅确保了系统的高效运行,还优化了用户体验。而 Jason Chen 凭借多年的行业经验,为项目的顺利推进提供了有力保障。
最后值得一提的是,Xin Hu 在云安全和认证机制上的努力也为 GPT- 4 的稳定运行提供了技术支持。同时,微软 Azure 团队在基础设施搭建方面给予了大力支持,必应团队则协助完成了部分部署工作。