DeepSeek百万年薪揽才，AI人才抢夺战升级

194次阅读

共计 1555 个字符，预计需要花费 4 分钟才能阅读完成。

DeepSeek 招人一事登上热搜第一，着实引发了广泛关注。其招聘条件令人咋舌，不限专业、经验，本科应届生竟有机会年薪百万。从 BOSS 平台公布的岗位信息来看，最高薪资达 110k×14，本科最高也有 90k×14，实习生 500 元一天起，月入轻松过万，最高日薪达一千元，难怪网友们纷纷投来羡慕目光，有人感慨 AI 如同当初的互联网，又有人要吃到时代红利了。截至发稿，BOSS 平台上 DeepSeek 的招聘职位已清空，原因尚不明朗。

仔细研读 DeepSeek 的招聘信息，会发现多数岗位本科起招，个别需硕士学历。无论专业背景与工作经验，大门向所有人敞开。核心系统研发工程师岗位，90K、14 薪，年薪 126 万，同样本科起步。不仅新招人员如此，其既有团队也十分年轻。去年初推出 V2 时，虽热度不及 R1，但也备受业内关注。Anthropic 联创 Jack Clark 认为背后有“高深莫测的奇才”，不过创始人梁文锋否认了这一猜测，团队成员多为 Top 高校应届毕业生、在读博士生及年轻从业者。像 v3 和 R1 版本，清北应届生表现活跃，有人在 2024 年一边在 DeepSeek 研究，一边博士学位论文获奖。为 DeepSeek 提出关键创新的也都是年轻人，甚至有实习生做出重要成果，如一篇被顶会 ICLR 2025 接收的论文，作者是大四实习生，在 DeepSeek 实习期间完成研究，如今已读博。这或许就是 DeepSeek 给实习生开出高薪的原因。梁文锋解释，追求短期目标找有经验的人合适，从长远看，基础能力、创造性和热爱更重要，招人看能力而非经验。再看招聘需求，虽表面“三不限”，实则要求颇高，要了解各类 AI 模型、掌握编程语言，部分岗位还需发表过顶刊或在知名竞赛获奖。这支年轻团队凭借实力与成果，将 DeepSeek 推向了与 OpenAI 竞争的舞台。

从岗位维度看，“全栈工程师”在 DeepSeek 招聘中占比较大。岗位描述简洁，内部管理主打“chill”。梁文锋介绍，员工入职后开启“放养模式”，交付重要任务，不设 KPI、不干预，让其自主发挥，人员和算力需求都会满足。每个人对卡和人的调动无上限，有想法可随时调用训练集群的卡，无需审批，且因无层级和跨部门限制，可灵活调用他人，只要对方感兴趣。例如 MLA 注意力机制，就是一位年轻人偶然想到的替代方案，DeepSeek 给予全力支持，组建团队将其实现。深入探究，DeepSeek 的内核年轻且具理想主义。梁文锋表示，其目标是做研究、探索，而非垂类和应用。在大模型创业者纷纷转向应用的趋势下，此选择虽艰难，但 DeepSeek 认为搞大模型不能靠拿来主义赚快钱，要推动真正的技术创新。这也解释了团队年轻化的原因，在不优先考量经济效益时，创新需要信念支撑，年轻人恰好最具信心与朝气。

DeepSeek 在人才和算力资源上投入巨大。招聘明确提供算力支持，通过挖掘知名半导体研究机构 Semianalysis 的报告可知，DeepSeek 拥有约 5 万块 Hopper GPU，GPU 投资超 5 亿美元。不过 5 万个 Hopper GPU 不等于 5 万个 H100，报告推测其拥有约 1 万个 H800 和 1 万个 H100，还订购了更多 H20，这些 GPU 在幻方量化和 DeepSeek 间共享。报告还解释了此前盛传的“DeepSeek V3 训练成本仅 600 万美元”的片面性，该数字只是预训练中 GPU 花费，未包含研发费用和硬件总体拥有成本等。实际上，DeepSeek 在硬件上支出远超 5 亿美元，开发新架构需大量资金和算力，如 MLA 机制前期投入巨大，耗时数月，但后续查询所需 KV 缓存减少约 93.3%，性价比仍有提升空间。春节假期未结束，腾讯云、阿里云、百度智能云等各大云计算就抢着上架 DeepSeek 模型，在如此高关注度下，开出天价招人也就不足为奇了。

正文完