共计 1854 个字符,预计需要花费 5 分钟才能阅读完成。
近年来,随着国产芯片行业快速发展,GPU 领域也涌现出一批颇具潜力的初创企业和老牌玩家。然而,据统计,2023 年中国平均每天约有 30 家芯片企业退出市场,显示了这一赛道的残酷性。
壁仞科技创始人张文曾指出,芯片行业是一条昂贵且充满风险的赛道,最终可能只有一两家公司存活下来。尽管如此,国内仍有一批企业展现出强劲的生命力。以下重点分析天数智芯、燧原科技、壁仞科技、沐曦集成电路和摩尔线程这五家国产 GPU 企业的现状与发展路径。
天数智芯:填补高性能 GPGPU 空白
成立于 2015 年的天数智芯,起初专注于软件开发,直至 2018 年才正式进入芯片设计领域。创始人李云鹏拥有深厚的软件背景,曾在美国甲骨文公司担任研发总监。他认为,要避免直接模仿英伟达,而是打造类似苹果的系统级公司。
天数智芯首款芯片“天垓 100”从立项到量产仅用三年时间,采用 7nm 制程工艺,集成 240 亿个晶体管,性能媲美国际主流产品。其主打 AI 训练任务,支持多种深度学习框架,并实现了 200 多种 AI 模型的高效训练。
此外,天数智芯还推出了面向推理任务的“智铠”系列芯片,与市场主流产品相比,性能提升 2 - 3 倍。依托强大的算力集群,天数智芯已成功支持多个百亿级参数的大模型训练项目。
燧原科技:自研架构与生态兼容
燧原科技于 2018 年在上海成立,创始团队来自 AMD 等国际知名企业。公司以云端训练和推理为核心业务,已发布四代五款芯片,涵盖训练加速卡、推理卡及智算一体机等全栈产品。
燧原科技的“邃思”系列芯片摒弃了传统的 GPU 设计经验,自主研发了一套独特的指令集和处理器架构。第二代产品“邃思 2.0”在算力和能效上均有显著提升,单精度浮点运算能力达到 40TFLOPS,远超同期英伟达 A100。
为了更好地融入 CUDA 生态,燧原科技开发了 TopsCC 编程模型,并推出了开源工具链和 SDK。同时,公司还推出了 200GB 双向 ESL 互联技术,大幅提升了多卡集群的训练效率。
壁仞科技:异构计算与智算中心布局
壁仞科技成立于 2020 年,凭借首款芯片 BR100 迅速跻身国内领先行列。BR100 在性能上实现了对英伟达 A100 的全面超越,尤其在异构计算方面表现突出。
壁仞科技自主研发的异构 GPU 协同训练方案 HGCT,首次实现了三种及以上异构芯片的联合训练,大幅缩短了模型训练周期。此外,公司还积极参与智算中心建设,与中国电信、中国移动等运营商展开深度合作。
壁仞科技还推出了 BIRENSUPA 软件平台,支持主流深度学习框架,并兼容 CUDA 生态。通过软硬件协同优化,公司进一步提升了产品的市场竞争力。
沐曦集成电路:GPGPU 与图形渲染双线并进
沐曦集成电路成立于 2020 年,团队成员均来自 AMD 中国,拥有丰富的芯片设计经验。公司采取先 GPGPU 后图形渲染的策略,逐步完善产品线。
其首款 7nm 工艺芯片“曦思 N100”已于 2022 年初流片成功,性能接近英伟达 A100。同时,沐曦还在积极研发图形渲染 GPU,预计 2025 年推出融合型产品。
沐曦的 MXMACA 异构计算平台,不仅支持主流编程语言,还兼容多种开源技术和 AI 框架,为开发者提供了便捷的开发环境。
摩尔线程:全功能 GPU 的本土实践
摩尔线程由英伟达前高管张建中创立,是国内少有的全功能 GPU 企业之一。公司成立以来,产品迭代速度极快,目前已发布三代全功能 GPU 芯片。
最新发布的“曲院”芯片延续了摩尔线程一贯的全功能设计理念,支持通用计算、人工智能加速、图形渲染和视频编解码等多重任务。借助 MUSIFY 工具,摩尔线程实现了 CUDA 代码的无缝迁移,极大降低了开发者的学习门槛。
摩尔线程还致力于智算中心建设,推出了国内首个全功能 GPU 底座的万卡集群解决方案。该方案已在多个重大项目中得到应用。
国产 GPU 的机遇与挑战
尽管国产 GPU 企业在技术上取得了长足进步,但要实现全面替代仍面临诸多困难。首先,软件生态建设仍是制约因素之一。其次,国产芯片在实际应用场景中的使用率偏低,部分数据中心的国产芯片占比不足三分之一。
中国工程院院士郑纬民认为,即使硬件性能稍逊,只要生态足够强大,用户依然会选择国产芯片。因此,加强软硬件协同、完善生态体系成为当务之急。
与此同时,国产芯片厂商还需探索多元化的商业模式,如提供 MaaS 服务、开发 AI PC 等创新产品,以拓宽收入来源。正如达晨财智执行董事姜铭所说,构建生态是一个长期过程,需要全产业链的共同努力。
总体而言,国产 GPU 企业正通过技术创新和生态布局,逐步缩小与国际巨头的差距。然而,要在激烈的市场竞争中站稳脚跟,这些企业还需付出更多努力。