杭州几家企业崛起,实力反超美国巨头

3次阅读

共计 2706 个字符,预计需要花费 7 分钟才能阅读完成。

杭州的人工智能产业近来可谓是风头正劲,在全球科技舞台上留下了浓墨重彩的一笔。有网友戏称,小小的杭州竟展现出了惊人的实力,成功超越了美国的三大科技巨头,着实令人惊叹。

1. 改变 AI 时代的底层逻辑

在人工智能领域,大模型的智能程度与支持的场景数量密切相关,而这也意味着对芯片和算力的需求极为庞大。全球范围内的算力需求不断攀升,英伟达正是凭借这一趋势,从一家普通的显卡厂商迅速崛起,成长为市值高达三万亿美元的行业巨擘。然而,即便集合英伟达、AMD、英特尔等众多半导体公司的力量,也难以满足 AI 市场持续上扬的算力需求。

就在众多 AI 公司为算力缺口发愁之时,来自杭州的幻方量化横空出世。这家 AI 创企发布了参数量高达 671B 的大模型 DeepSeek-V3。令人瞩目的是,该模型仅仅使用了 2048 块 GPU 进行了 2 个月的训练,花费仅 557.6 万美元。相比之下,OpenAI 的 GPT-4o 训练成本约为 1 亿美元,且至少需要在 10000 个 GPU 的计算集群上进行训练。幻方量化仅用了五分之一的芯片和二十分之一的成本,便训练出了处于参数量第一梯队的大模型,这一成果瞬间在 AI 市场引发了轰动。

前 OpenAI 联合创始人、Tesla AI 团队负责人 Andrej Karpathy 在社交平台发文赞叹:“Llama 3 405B 使用了 3080 万 GPU 小时,而 DeepSeek-V3 看起来是一个更强大的模型,仅使用了 280 万 GPU 小时(计算量约为十分之一)。”他还表示:“如果 DeepSeek-V3 的优良表现能够得到广泛验证,这一模型将是在资源受限的情况下,在研究和工程方面让人印象深刻的一次展示。”

据 DeepSeek-V3 研发团队介绍,能够以较低成本完成高难度大模型训练,主要得益于采用了高效推理的多头潜在注意力(MLA)和用于经济训练的 DeepSeekMoE。多 Token 预测目标(Multi-Token Prediction,MTP)有助于提高模型性能,还可用于推理加速的推测解码。团队采用创新方法,将推理能力从长思维链模型(DeepSeek R1)中蒸馏到标准模型上。这种“分布式推理”的方式虽早有人提出,例如 OpenAI 联合创始人兼前首席科学家 Ilya Sutskever 就曾说过:“我们已经达到了数据峰值,AI 预训练时代无疑将终结。”但没想到的是,在“分布式推理”领域,一向将中国大模型视为“廉价替代品”的美国企业,竟被杭州的这家企业抢占先机,着实给他们上了一课。DeepSeek-V3 的出现,让 AI 世界如同享受到了拼多多式的高性价比体验。

2. 从机器人到半导体设计

幻方量化 DeepSeek-V3 的出现,让硅谷巨头们切实感受到了中国 AI 产业的迅猛发展势头,而宇树和毫微的表现,则持续给他们带来压力。

前不久,宇树发布了旗下行业级机器狗 B2-W(B2 机器狗的进阶版)的炫技视频。视频中,B2- W 机器狗展示了出色的运动能力,它能够爬山、涉水、越障,在崎岖地形和颠簸路面上流畅行走。此外,还能完成原地旋转稳停、两足倒立旋转、2.8 米高楼飞跃等高难度杂技动作,并且可负载 40 千克行走,轻松承载一个成年男性的重量。

宇树 B2- W 机器狗的视频引发了全网热议,远在太平洋彼岸的马斯克也忍不住转发并评论称赞。B2- W 机器狗并非只是一个新奇的“高价宠物”,它在专业领域有着广泛的应用前景,如安防巡检、勘测探索、公共救援、医疗防疫陪护等危险场景,能够有效避免人员面临事故风险。据新华社报道,警用机器狗已加入成都市公安局高新区分局巡逻大队,开展安全巡逻和宣防工作。

值得一提的是,机械狗原本是美国高科企业的代表,像波士顿动力早在 2005 年就研发出了第一款“大狗机器人”。曾经,宇树基本是跟着波士顿动力的步伐亦步亦趋,从产品形态到商业生态位,走的都是“平替版”路线。然而,仅仅数年时间,宇树就成功研发出运动性更高、平衡性更强的动轮方案,取代了波士顿动力的四足方案,并在一年内完成了户外环境跋山涉水的训练。这一成果让不少波士顿动力的忠实粉丝大为震惊,甚至怀疑宇树 B2- W 机器狗的视频是 AI 生成的 CGI 画面。

除了在机器人领域的突破,在半导体领域,杭州的毫微也向行业“巨人”英伟达发起了挑战。12 月 26 日,Nano Labs 正式推出 FPU3.0,采用 ASIC 架构,在能效上实现了五倍的提升,树立了能源高效、高性能 ASIC 的新标准。该产品可广泛应用于 AI 推理、边缘 AI 计算、5G 数据传输处理和网络加速等领域。

毫微作为 AI 与区块链技术的资深玩家,是国内领先的无晶圆厂 IC 设计公司。自 2022 年起,便陆续推出多款 HTC 和 HPC 芯片设计的全新基础构架芯片。目前,ASIC 架构芯片已成为 AI 世界的主流选择。在执行大规模特定的 AI 任务时,ASIC 这种针对特定应用设计的专用芯片,能够进一步提高计算效率、降低功耗并提升性能。摩根士丹利发布的研报《AI ASIC 2.0:潜在赢家》认为,ASIC 凭借针对性优化和成本优势,有望逐步从英伟达 GPU 手中争取更多市场份额。预计 AI ASIC 市场规模将从 2024 年的 120 亿美元增长至 2027 年的 300 亿美元,年复合增长率达到 34%。当下,ASIC 芯片的应用范围不断扩大,谷歌、Meta、微软、亚马逊等大厂都计划推出自家的 AI ASIC 芯片。

3. 为什么是杭州?

曾经有这样一个热门段子:“中美贸易战里最大矛盾,是华盛顿市宾夕法尼亚大街 1600 号临时居民与深圳市南山区粤海街道企业之间的纠纷。”其中,“华盛顿市宾夕法尼亚大街 1600 号”指的是美国白宫,“深圳市南山区粤海街道企业”则是华为、大疆、中兴、腾讯等位于深圳南山区粤海街道的中国科技大厂。如今,随着中美贸易战热度的降低,科技斗争的焦点逐渐转移到了当下互联网的核心——AI 领域。与之相应的是,和美国科技巨头的对抗前沿,也从深圳南山区转移到了杭州。

其实,早在 AI 浪潮兴起之前,杭州就已被誉为人工智能的“东方硅谷”,更是国内首座“人工智能之城”。2016 年 10 月,杭州成为全球第一个启动“城市大脑”基础建设的城市。杭州安装了人工智能中枢——杭州城市数据大脑,旨在让数据辅助城市进行思考和决策,打造一座能够自我调节、与人类良性互动的城市。

美国著名城市理论家、社会哲学家 Lewis Mumford 在《技术与文明》中提到,人类城市发展历经古希腊城市(初始文明)、中世纪基督教城市(商业文明)、近代和现代工业城市(工业文明)三个阶段。而全世界第一个启动城市大脑的杭州,正引领着城市文明迈向第四次浪潮,一座基于互联网、数据和人工智能的“科技之城”正在崛起。这或许就是杭州能够孕育出众多优秀 AI 企业,并在与美国科技巨头的竞争中崭露头角的原因所在。

正文完
 0