共计 4193 个字符,预计需要花费 11 分钟才能阅读完成。
春节过后,杭州频繁成为焦点,这背后离不开六家备受瞩目的企业 —— 深度求索(DeepSeek)、宇树科技、云深处科技、游戏科学、强脑科技以及群核科技。它们在科技前沿领域取得卓越技术突破,成为社会热议话题,其崛起是前沿科技企业发展和浙江省经济结构转型的体现。
杭州的雄心不止于此,近日杭州国资出资 10 亿元投资北京知名 AI 独角兽 —— 智谱,开始押注第二个 DeepSeek。智谱是大模型领域独角兽企业,刚完成超 10 亿元战略融资,投资方包括杭州城投产业基金、上城资本等,旨在推动智谱国产基座 GLM 大模型技术创新和生态发展。自去年 12 月 17 日智谱宣布完成 30 亿元融资后,不到 3 个月又获新融资,这也是大模型“六小虎”今年首次融资。
根据企查查数据,这是智谱第 11 笔融资,此前投资方众多,从 VC 到互联网巨头,再到国资背景,智谱实力不断得到验证。智谱表示,新一轮融资用于推动国产基座 GLM 大模型技术创新和生态发展,已在杭州成立浙江智谱新篇科技有限公司,服务浙江省及长三角地区经济实体,推动区域经济数字化转型与升级。
清华实验室孵化出的人工智能独角兽
智谱 AI 脱胎于清华大学 KEG 实验室。2017 年实验室开始做 AI 预训练模型,为智谱 AI 算法研究夯实基础。KEG 实验室特点是长期有工程师和研究员共同工作,团队成员既能解决 AI 算法科研问题,也能解决工程应用问题。
2019 年,在 CEO 张鹏带领下,团队走出清华实验室,智谱 AI 正式成立。虽成立不久,但团队在该领域积累深厚,研究内容前沿。
2020 年 5 月,OpenAI 发布 GPT-3,将预训练模型参数规模推到 1000 亿以上,模型智能超乎想象。这是智谱 AI 投入大模型研究关键节点之一,GPT- 3 发布后,智谱 AI 开始研究参数量影响,对投入更多资源做大模型想法更坚定。
团队结合西方 AI 技术,将 GPT 单向向后预测模型框架与谷歌 BERT 双向预测模型框架能力相结合,诞生国产大模型路径 GLM。此时,智谱 AI 或许已从对标 OpenAI 转变为超越 OpenAI。
此后,智谱 AI 研究进展顺利。2021 年训练完成百亿参数模型 GLM-10B,同年利用 MoE 架构成功训练出收敛的万亿稀疏模型,2022 年合作研发中英双语千亿级超大规模预训练模型 GLM-130B。
据悉,GLM-130B 是 2022 年亚洲唯一入选斯坦福评测的全球主流大模型,让智谱 AI 声名鹊起,吸引多家资本机构和头部企业关注,在国内及硅谷头部科技企业都得到认可。
智谱凭借强大技术实力,资本之路顺畅。B 轮及之前获中科创星、达晨财智等知名 VC 机构投资;B- 2 轮开始,除高瓴等新机构,还获美团、腾讯、阿里巴巴等互联网大厂 CVC 押注;后来又有北京市人工智能产业投资基金等国资投资,中东石油巨头沙特阿美旗下风险投资部门管理的基金 Prosperity 也曾投资 6 亿美元。如此融资历史,在大模型独角兽中独一无二。
在商业落地上,智谱 AI 成就斐然。当前投资机构对赛道拷问从数据能力转向落地能力,智谱 AI 采用以 toB 为主、toC 为辅策略,符合团队基因和经验。
面向 B 端客户,智谱 AI 践行 MaaS 服务模式,推出大模型 MaaS 开放平台,可根据客户需求提供专属私有化部署、API 调用等多种大模型解决方案。智谱称其 MaaS 平台已支撑 70 余万企业、应用开发者;私有化部署服务金融、医疗等 20 多个行业,在万余家企事业单位规模化应用。
2024 年下半年,智谱先后推出对标 OpenAI 相应模型性能的基座模型 GLM-4-Plus、Agent 模型 AutoGLM、推理模型 GLM-Zero 等。前不久,智谱宣布开源计划,称 2025 年将是开源年,很快会发布全新大模型并开源。
继长推理模型之后,智谱押注下一个技术爆发点 agent。2025 年是 agent 关键一年,OpenAI 于今年 1 月推出智能体 Operator、Deep Research。智谱提出 Phone Use 概念,推出能模拟用户跨应用自主操作的 AutoGLM 和 GLM-PC,并基于 Agentic GLM 与三星手机展开合作。
值得一提的是,智谱于 3 月 4 日完成 2025 年第一个模型 —— 首个支持生成汉字的开源文生图模型 ——CogView4,在 DPG-Bench 基准测试中综合评分排名第一,在开源文生图模型中达到 SOTA,且是首个遵循 Apache 2.0 协议的图像生成模型。
智谱表示,CogView4 具备较强复杂语义对齐和指令跟随能力,支持任意长度中英双语输入,能生成给定范围内任意分辨率图像,文字生成能力也较强。
频频出圈的杭州
春节后,杭州凭借“六小龙”迅速引发关注,全网出现“为什么是杭州?”和“怎么复刻杭州?”等问题。
有意思的是,“六小龙”创始人大多非杭州人,却纷纷选择在杭州创业。杭州是安宁之地、山水胜地,也是梦想孵化器。马云、丁磊在此缔造阿里巴巴、网易;还有安防双雄海康威视、大华,汽车巨头吉利、零跑等。如今“六小龙”接力,杭州完成城市基因迭代。这些企业创始人虽非杭州本地人,但都在此追逐梦想,正如作家李杭育所说:“杭州是天下人的杭州。”
“良禽择木而栖,贤臣择主而事”,优秀企业选择杭州,或许是因其优秀营商环境。杭州作为中国科技创新重要高地,近年来推出一系列针对性强、覆盖面广的专项政策,为科创企业提供税收减免、研发补贴和绿色通道等多维度支持。这些政策降低企业运营成本,使其能专注技术研发与产品创新。
例如,2023 年杭州市为实施营商环境优化提升“一号改革工程”,发布《杭州市人民政府关于全力打造营商环境最优市赋能经济高质量发展的实施意见》。文件提出将杭州打造成为营商环境标杆城市,具体措施包括:降低企业综合融资成本,引导金融机构建立“连续贷 + 灵活贷”机制,开展首贷户专项行动,加强对中小微企业信贷支持;完善政府性融资担保体系,确保政府性融资担保机构支农支小平均担保费率不高于 0.8%;打造“3+N”杭州产业基金集群,创新产业基金运作管理机制,完善投资尽职免责机制。
此外,政府开放医疗、交通等城市数据和场景资源,为企业搭建商业化验证“试验场”。如宇树科技和云深处科技的机器人在这些场景成功应用,优化产品性能,经媒体报道,向公众展示科技创新对生活的改变。
新华社评论称:“六小龙”成功非偶然,源于对创新的执着、坚韧精神及不断优化的营商环境。杭州以沃土滋养创新,以改革激发活力,在发展新质生产力方面大有可为,“神秘的东方力量”将为世界带来更多惊喜。
同时,杭州本地资本扶持不容忽视。杭州活跃的创投生态为“六小龙”成长注入资金支持。科技初创企业早期需大量资金,“六小龙”背后有“奋发有为的国有资本”发挥作用。
以杭州市级资金为例,杭州市国有资本投资运营有限公司管理的杭州科创基金和杭州创新基金,覆盖“六小龙”中的四家企业。这两只基金是杭州“3+N”产业基金集群重要组成部分,2023 年 6 月诞生。杭州科创基金是政策性政府引导基金,侧重“投早、投小、投科”;杭州创新基金是市场化国资产业基金,专注战略性新兴产业,“投强投大投产业”。
截至 2025 年 2 月,两大千亿基金总批复规模超 1850 亿元,撬动社会资本约 1350 亿元,累计投资金额达 725 亿元,通过基金投资和科创金融等方式服务支持了 120 家上市公司(含并购上市)。
此外,杭州是国内“资金第五城”,民间资本活跃。本土投资机构如华睿投资、普华资本等推动杭州创投生态繁荣。根据中国证券投资基金业协会数据,截至 2025 年 2 月 16 日,注册地和办公地均在杭州的私募基金管理人达 616 家,管理基金数量合计 5042 只。
在杭州,产业引导基金与民间资本相互促进、协同,形成较完整创投生态。当前,以人工智能为代表的新一轮科技革命席卷全球,改变生产模式、提升生产效率,杭州通过精准布局和专业服务,为这股“神秘东方力量”发展注入动力。
大模型六小虎格局生变
随着 DeepSeek 迅速崛起,国内 AI 市场“六小虎”格局显著变化,其商业化进程和开源策略近期成为焦点。
2025 年,加速商业化是众多 AI 企业共同目标。回顾 2024 年,各大模型厂商忙于价格战和流量营销战。但随着 DeepSeek V3、R1 等高性能模型开源,许多厂商重新评估闭源模型盈利能力。
DeepSeek 的广泛关注促使“六小虎”战略调整。以 C 端为主的 Kimi 此前采取“重投放”策略,近期公司内部反思并决定减少投放,专注基础模型训练。
月之暗面强调坚持基础模型的 SOTA,并计划重新训练基础模型,同时抓住应用层机会,选定开发一款面向深度研究领域的智能体产品 DeepResearch。
零一万物可能在 B 端寻找新增长点。年初回应部分团队并入阿里采访时,零一万物 CEO 李开复表示,去年 5 月发布 Yi-Large 模型时,团队意识到模型在速度和性价比上不足,决定放弃原计划开发的 Yi-X-Large 模型。李开复认为,2025 年零一万物机会在于挖掘 To B 大模型的 PMF。
MiniMax 在 1 月 15 日发布新一代 01 系列模型并开源,相比 Kimi k1.5 的 12.8 万个 token,01 系列模型支持最多 400 万个 token 的上下文输入。百川智能专注大模型在医疗领域应用,近期与国家儿童医学中心北京儿童医院签署战略合作协议,计划共同推出 5 款 AI 医疗产品。
智谱去年 12 月筹集 30 亿资金,拿下价值千万美元的“一带一路”国家订单。节后不到一个月收入过亿,实现吸金和淘金双重目标。
2025 年不仅是商业大考之年,也被视为模型开源之年。智谱表示:“2025 年将是智谱的开源年,我们将发布全新大模型并开源。DeepSeek 开源周刚结束,期待更多国产技术接棒,为国产大模型生态注入更多动力。”上文提到的 CogView4 正是智谱在 2025 年发布的大模型。
事实上,随着 DeepSeek R1 开源,百川智能、阶跃星辰、百度等厂商加入开源行列,模型厂商之间开源之战将更激烈,它们将与 DeepSeek 争夺技术客户和开发者,培养自己的创新生态。
继长推理模型之后,智谱押注下一个技术爆发点 Agent。2025 年是 Agent 关键一年,OpenAI 今年 1 月推出智能体 Operator 和 Deep Research。智谱率先提出 Phone Use 概念,推出能模拟用户跨应用自主操作的 AutoGLM 和 GLM-PC,并与三星手机展开合作,在国内外大模型中领先。此外,阶跃星辰还与瑞幸、OPPO 等合作研发 Agent。
毫无疑问,随着开源带来的风口,模型厂商之间竞争将在今年更加激烈。