共计 1555 个字符,预计需要花费 4 分钟才能阅读完成。
DeepSeek 百万年薪揽才,AI 人才抢夺战升级
DeepSeek 招人一事登上热搜第一,着实引发了广泛关注。其招聘条件令人咋舌,不限专业、经验,本科应届生竟有机会年薪百万。从 BOSS 平台公布的岗位信息来看,最高薪资达 110k×14,本科最高也有 90k×14,实习生 500 元一天起,月入轻松过万,最高日薪达一千元,难怪网友们纷纷投来羡慕目光,有人感慨 AI 如同当初的互联网,又有人要吃到时代红利了。截至发稿,BOSS 平台上 DeepSeek 的招聘职位已清空,原因尚不明朗。
仔细研读 DeepSeek 的招聘信息,会发现多数岗位本科起招,个别需硕士学历。无论专业背景与工作经验,大门向所有人敞开。核心系统研发工程师岗位,90K、14 薪,年薪 126 万,同样本科起步。不仅新招人员如此,其既有团队也十分年轻。去年初推出 V2 时,虽热度不及 R1,但也备受业内关注。Anthropic 联创 Jack Clark 认为背后有“高深莫测的奇才”,不过创始人梁文锋否认了这一猜测,团队成员多为 Top 高校应届毕业生、在读博士生及年轻从业者。像 v3 和 R1 版本,清北应届生表现活跃,有人在 2024 年一边在 DeepSeek 研究,一边博士学位论文获奖。为 DeepSeek 提出关键创新的也都是年轻人,甚至有实习生做出重要成果,如一篇被顶会 ICLR 2025 接收的论文,作者是大四实习生,在 DeepSeek 实习期间完成研究,如今已读博。这或许就是 DeepSeek 给实习生开出高薪的原因。梁文锋解释,追求短期目标找有经验的人合适,从长远看,基础能力、创造性和热爱更重要,招人看能力而非经验。再看招聘需求,虽表面“三不限”,实则要求颇高,要了解各类 AI 模型、掌握编程语言,部分岗位还需发表过顶刊或在知名竞赛获奖。这支年轻团队凭借实力与成果,将 DeepSeek 推向了与 OpenAI 竞争的舞台。
从岗位维度看,“全栈工程师”在 DeepSeek 招聘中占比较大。岗位描述简洁,内部管理主打“chill”。梁文锋介绍,员工入职后开启“放养模式”,交付重要任务,不设 KPI、不干预,让其自主发挥,人员和算力需求都会满足。每个人对卡和人的调动无上限,有想法可随时调用训练集群的卡,无需审批,且因无层级和跨部门限制,可灵活调用他人,只要对方感兴趣。例如 MLA 注意力机制,就是一位年轻人偶然想到的替代方案,DeepSeek 给予全力支持,组建团队将其实现。深入探究,DeepSeek 的内核年轻且具理想主义。梁文锋表示,其目标是做研究、探索,而非垂类和应用。在大模型创业者纷纷转向应用的趋势下,此选择虽艰难,但 DeepSeek 认为搞大模型不能靠拿来主义赚快钱,要推动真正的技术创新。这也解释了团队年轻化的原因,在不优先考量经济效益时,创新需要信念支撑,年轻人恰好最具信心与朝气。
DeepSeek 在人才和算力资源上投入巨大。招聘明确提供算力支持,通过挖掘知名半导体研究机构 Semianalysis 的报告可知,DeepSeek 拥有约 5 万块 Hopper GPU,GPU 投资超 5 亿美元。不过 5 万个 Hopper GPU 不等于 5 万个 H100,报告推测其拥有约 1 万个 H800 和 1 万个 H100,还订购了更多 H20,这些 GPU 在幻方量化和 DeepSeek 间共享。报告还解释了此前盛传的“DeepSeek V3 训练成本仅 600 万美元”的片面性,该数字只是预训练中 GPU 花费,未包含研发费用和硬件总体拥有成本等。实际上,DeepSeek 在硬件上支出远超 5 亿美元,开发新架构需大量资金和算力,如 MLA 机制前期投入巨大,耗时数月,但后续查询所需 KV 缓存减少约 93.3%,性价比仍有提升空间。春节假期未结束,腾讯云、阿里云、百度智能云等各大云计算就抢着上架 DeepSeek 模型,在如此高关注度下,开出天价招人也就不足为奇了。