全栈自研破壁垒:解码沐曦GPU从技术突围到商业化落地|未来企业调研行

  行业动态     |      2026-06-18 13:20

  PG电子试玩PG电子试玩

全栈自研破壁垒:解码沐曦GPU从技术突围到商业化落地|未来企业调研行

  2025年春节期间,当DeepSeek模型引发行业热烈讨论之时,沐曦股份的技术团队就已经完成了该模型在自研GPU上的适配调试。这份抢先一步的成果,并非偶然的运气,而是团队长期坚持“技术预见”、主动探索的结果。一个小小的模型适配细节,背后折射出一家国产GPU企业敏锐的行业嗅觉、扎实的技术功底与敢闯敢拼的团队底色。

  如今,人工智能、生成式应用、数字孪生广泛赋能千行百业,算力成为支撑新质生产力的核心底座。全球GPU市场长期由海外巨头主导,技术壁垒、生态鸿沟横亘在国产厂商面前,行业竞争也早已告别单纯比拼硬件参数的阶段,开发者生态、场景服务的综合实力,成为决胜关键。在这样的产业背景下,《华夏时报》启动未来企业竞争力调研行,首站走进沐曦集成电路(上海)股份有限公司。这家2025年12月登陆科创板的硬科技企业,坚持全栈自研路线,从底层芯片核心IP到软件生态稳步深耕。我们透过一个个研发、攻坚、坚守的真实故事,解码沐曦股份的核心竞争力,也以此窥探国产算力产业的突围方向与未来潜能。

  用沐曦股份高级副总裁孙国梁的话来说,一块高性能GPU芯片,从最初的架构勾勒,到反复调试,再到流片,往往要历经上万次测试打磨,漫长的研发之路考验着每一位从业者的耐心与坚守。沐曦股份多年来始终沉心深耕,在国产高性能GPU这条长赛道上稳步前行,用一步步的突破回应市场与行业的期待。

  “沐曦从创业之初就定下全栈自研的发展方向,不依赖外部现成技术与IP,坚持从底层架构开始打磨每一项核心技术,这也成为企业安身立命的根本。”沐曦股份高级副总裁孙国梁说道。依托这份执着的研发精神,沐曦股份凭借多年深耕,如今已搭建起四大成熟的GPU产品序列,形成覆盖全算力场景的完整矩阵。曦云C系列主打训推一体,聚焦AI大模型训练、通用计算等场景;曦思N系列专攻推理,适配智慧城市、生成式AI等领域;曦彩G系列聚焦图形赛道,服务云游戏、等应用;2026年1月推出的曦索X系列,则针对材料科学、生命科学、生物制药等高端科研场景优化,补齐了科学智能场景的算力布局。四个产品序列全面覆盖当下主流算力需求。

  对于沐曦股份来说,2025年不仅是登陆资本市场的重要节点,也是其产品迭代与供应链建设的关键一年。这一年,沐曦股份推出的曦云C600系列,不仅算力相比上代产品大幅提升,更重要的是首次实现了全国产供应链工艺落地。该产品于2025年年末进入风险量产,目前已实现了量产销售,正式推向市场。全国产化方案也让企业彻底提升了供应链自主把控能力。

  持续的研发投入,是技术突破最坚实的后盾。根据2025年年报数据,沐曦股份全年研发投入达10.27亿元,研发投入占营业收入比例高达62.49%。持续投入催生出一系列硬核成果:企业自研的MetaXLink高速互连技术,单颗芯片集成7个专用接口,带宽性能对标国际旗舰产品,可支持2卡至128卡集群互连,兼顾小型任务与超大规模大模型训练。同时企业自主研发的MXMACA指令集包含600条计算指令与800条渲染指令,实现安全可控的全流程技术覆盖。截至2026年4月底,公司共拥有530多项国家专利、软件著作权、集成电路布图设计、商标等知识产权,技术储备稳居国内GPU行业第一梯队。

  在孙国梁看来,AI大模型算法迭代速度飞快,GPU行业永远没有“一劳永逸”的技术。为此企业始终遵循“量产一代、在研一代、规划一代”的研发思路,“量产一代”稳固市场,“在研一代”跟进需求,“规划一代”前瞻布局,支撑长期竞争力与市场份额提升。他也客观坦言,国产GPU与国际顶尖产品仍存在差距,但脚踏实地坚持全栈自研,才是本土企业长久发展的必经之路。

  如果说硬件芯片是算力的“骨架”,软件生态就是激活硬件价值的“血肉”。拥有国内稀缺的全建制团队、核心团队拥有20年以上行业经验的沐曦股份,早已洞悉软硬件并举的必要性并付诸行动,而这份前瞻布局,也在一次次大模型适配、技术攻坚中落地见效。

  研发人员张瑞(化名)所在的团队,早已把“跟踪新发大模型、上机测试适配”变成了日常工作习惯。2025年DeepSeek模型刚刚问世之际,团队便凭借多年的技术积累和行业敏感度,启动适配工作,在春节假期前就完成了模型在沐曦GPU上的稳定运行。当该模型成为行业热点时,沐曦股份早已抢先完成布局。而当行业转向千亿MOE模型,分布式推理成为行业难题时,张瑞再次扛起攻坚重任。此时的他不再只是单纯的技术执行者,而是团队的“路线规划者”。他坚持深入一线代码与实验,亲自验证每一条技术路径,再将复杂的攻坚目标拆解为清晰的任务,协调跨团队工程师协同作战。团队同步对接MXMACA开源社区,结合硬件特性做创新改造。历时近五个月的连续攻坚,团队成功搭建起全新分布式推理系统,相比原有方案,单卡性能实现五倍跃升。

  从快速适配热门大模型,到攻坚分布式推理技术,一个个案例印证了沐曦股份在软件领域的深厚实力。这也是沐曦股份的核心优势。当前,国内不少厂商陷入“重硬件、轻软件”的误区,仅做基础软件适配、采用闭源模式,最终形成生态孤岛。而沐曦股份从创业初期就将软件生态置于同等战略高度,坚持硬件、软件双轮并行。

  MXMACA软件栈是沐曦生态体系的核心载体。这套自研软件工具链原生兼容国际主流生态,开发者无需大幅改写代码,就能完成适配、应用迁移,极大降低使用门槛。2025年2月,沐曦股份正式上线开源社区,以开放姿态拥抱全行业开发者。截至2026年5月,MXMACA软件栈注册的开发者用户已近50万人,网络API调用次数超5591万次,文件下载量突破16万次。目前软件已适配6000余个主流应用、1000多款大模型,针对Qwen3.5、智谱GLM等超25款标杆模型完成“Day0适配”——实现模型上线即适配。作为国内少数开放核心软件、公开SDK并配套中英文文档的GPU企业,沐曦股份目前已累计发布30余个开源项目、分享500余份开发手册。

  沐曦股份联合创始人、CTO兼首席硬件架构师彭莉近日登上央视《对线%的开源工作,MXMACA软件栈届时将全面开源,开发者社区也将冲击100万人的规模大关。在她看来,开源相当于统一度量衡和语言,“大家都用沐曦MXMACA生态,这会成为我们最大的护城河。”

  不仅面向行业开发者,沐曦股份还将MXMACA引入国内半数以上C9高校,从人才源头培育新生代算力开发者,为生态长期发展积蓄力量。针对全新的曦索X系列科学计算GPU,技术团队也完成了专项软件优化,可稳定支撑基因分析、材料模拟等数十个科学智能科研场景,实现软硬件的深度适配。孙国梁表示,软件生态的建设是一场长期工程,只有保持开放姿态,吸引更多开发者参与,硬件产品的价值才能真正释放,国产算力的生态才能快速繁荣。

  软硬件的深度协同,推动企业营收结构不断丰富。2025年,沐曦股份实现营业收入16.44亿元,同比增长121.26%。从业务结构来看,GPU板卡及配件等硬件产品是营收基本盘,全年收入16.31亿元。细分产品的销量数据,更能直观体现市场认可度:训推一体GPU板卡销量同比增长147.31%,智算推理GPU板卡销量同比飙升866.02%。截至2025年末,公司GPU产品累计出货量突破55000颗,产品陆续落地国内十余个智算集群,算力网络覆盖北京、上海、杭州、长沙等多个地区。而IP授权、技术服务业务同步发力,全年营收1333.90万元,同比增长59.59%,该板块毛利率高达98.22%,高附加值特征凸显,印证了自研GPU底层对外商业化的长期潜力。孙国梁分析,当下算力需求不再局限于单一训练场景,云、边、端融合成为行业主流,沐曦股份多元化的产品与生态布局,恰好能匹配不同场景的差异化需求。

  随着产品出货量持续增加、应用场景不断拓宽,叠加软件服务业务稳步增长,规模效应将逐步显现,企业盈利的窗口期也在不断拉近。

  GPU行业的竞争,终究是人才与匠心的比拼。从顶层架构研发,到软件生态搭建,再到产线质量把控,每一个环节都离不开坚守岗位的从业者。在沐曦股份的芯片量产测试环节,李玲(化名)和搭档朱晓(化名)就经历了一场长达两个月的“破案之旅”。

  量产阶段,产线出现一个棘手问题:部分芯片测试结果显示合格,但对应的测试日志却莫名丢失。实验室小批量测试从未出现异常,一旦进入工厂大规模生产,数据就随机“失踪”。两人尝试延长保存时间、增加数据刷新等多种常规办法,一次次满怀希望进厂调试,又一次次迎来失败。在反复尝试无果后,她们放弃实验室推演,穿上防静电服,守在工业机台旁,紧盯数据流。无数个日夜的蹲守后,一行一闪而过的“路径连接失败”提示被捕捉,众人终于找到根源:工厂复杂电磁环境造成毫秒级连接闪断,进而导致数据丢失。找到问题后,团队新增心跳检查与自动重连机制,更换抗干扰传输线,彻底根除了这一隐患。两个月、上百次尝试,这份较真与坚守,正是沐曦一线员工的真实写照。

  这份扎根细节、精益求精的态度,贯穿于企业整个团队。截至2025年末,沐曦股份全体员工共925人,其中研发人员675名,占比达到73%。创始团队拥有二十年左右的GPU设计与量产经验,核心骨干均具备行业头部企业从业背景。公司内部没有严苛的部门壁垒,硬件、软件、算法工程师可以联合攻坚;面对创新试错,企业始终保持包容态度,鼓励团队大胆探索。日常的技术分享会、老带新的交流模式,也让团队形成了互帮互学的良好氛围。不少员工坦言,投身国产GPU事业,早已不只是一份工作,更是一份共同的理想。“胜则举杯相庆,败则拼死相救”——沐曦股份将这句话置于企业文化展览墙上,背后正是团队日常协作中彼此信任、互相支撑的真实写照。

  除了宽松的研发氛围,沐曦股份搭建了完善的人才激励与培养体系。2025年年报显示,公司75.5%的员工参与持股计划,将个人发展与企业发展深度绑定。同时企业建立全维度培训体系,覆盖新人培养、专业技能、管理能力等多个维度。面对全行业GPU人才缺口,沐曦股份还向清华大学、浙江大学等高校设立专项奖学金,联动学界培育集成电路后备人才。孙国梁表示,留住人才、培育人才,是企业和行业长久发展的核心。

  完善的激励机制、包容的企业文化、志同道合的团队,多重优势叠加,让沐曦股份拥有穿越行业周期的底气。对于重研发、长周期的硬科技企业而言,技术可以迭代,产品可以更新,但一支有理想、有韧性、肯钻研的团队,才是最核心的无形资产。

  站在2026年仲夏回望,沐曦股份在过去两年接连交出亮眼答卷:成功登陆科创板、完成曦云C600全国产化芯片的量产销售、营收实现翻倍增长、曦索X系列新品正式亮相,生态用户规模持续扩容。日前,沐曦股份正式宣布冲刺港股IPO,开启资本市场新征程,彰显了企业加速全球化布局、深化技术研发的坚定决心。但公司也清醒地看到,GPU行业投入大、周期长、国际巨头环伺的竞争格局未变,供应链自主化与经营效率仍需持续精进。

  沐曦股份的成长故事,也是当下众多国产硬核科技企业的缩影。在国内算力需求持续释放、“东数西算”工程稳步推进的大背景下,本土GPU企业放弃短期捷径,选择全自研的长期路线,一步一个脚印向前奔跑。如今的算力竞争,早已不再是单颗芯片性能的比拼,而是硬件、软件、生态、供应链、场景服务的较量。从单一产品到全矩阵布局,从硬件突破到生态共建,从技术攻坚到产业联动,沐曦股份走出了一条属于自己的突围之路。我们期待像沐曦股份一样的科创企业继续稳步前行,用技术创新赋能千行百业,也相信越来越多的本土科技力量会成长壮大,共同构筑起坚实的国产算力体系,助力数字经济发展行稳致远。