游戏百科

AI框架进化论:昇思MindSpore左手“技术摸高” 右手“好用易用”

即将过去的2025年,“超节点”成为AI领域的热门关键词。随着大模型参数规模持续变大,主流硬件厂商纷纷布局超节点,推动A

即将过去的2025年,“超节点”成为AI领域的热门关键词。随着大模型参数规模持续变大,主流硬件厂商纷纷布局超节点,推动AI算力基础设施迈入了“超节点时代”。算力架构革新之下,被誉为“AI领域操作系统”的AI框架,也迎来新的架构范式。

12月25日在“AI之城”杭州举行的昇思人工智能框架峰会上,昇思MindSpore聚焦超节点技术创新,重磅打造昇思HyperParallel架构,激发超节点架构优势,充分释放硬件算力,加速Agentic AI、全模态等新模型结构和新训推范式创新,引领AI框架迈入“超节点时代”。

“技术摸高”的同时,深耕开源领域5年多的昇思MindSpore还以“好用易用”为核心,构筑了开发友好的领先生态。目前昇思MindSpore全球下载量超1300万,覆盖156个国家和地区,社区贡献者超5.2万,合入请求达12万+;完善地支持超过25种不同系列大模型,携手2000+合作伙伴落地3100+行业应用,支撑近2500篇学术论文创新,成为国内最具创新活力的AI框架开源社区。

昇思MindSpore开源社区理事长 丁诚

从本次峰会成果看,昇思MindSpore紧扣AI时代变革脉搏,一手抓技术突破,一手抓生态易用,正携手全球开发者共建繁荣开源生态,赋能千行百业智能化转型,释放AI创新的澎湃动能。

技术摸高:AI框架正式迈入“超节点时代”

回顾开源5年来的征程,昇思MindSpore从原生大规模并行,到端边云全场景部署,再到科学计算加速,每一步都精准踩中了AI发展的关键进程。此番昇思HyperParallel架构的诞生,则是对模型发展驱动AI基础设施从“服务器集群时代”迈入“超节点时代”的最新回应。

面对模型规模走向长序列和稀疏的十万亿级,模型结构走向非规则化,训推范式走向异构化的主流趋势,昇思HyperParallel架构通过HyperOffload多级智能卸载、HyperMPMD异构非规则并行、HyperShard声明式并行编程三大技术创新,把超节点当作一台“超级计算机”来统一编程和调度,相当于给复杂的算力网络装上了“智慧大脑”,能够释放超节点架构的极致潜能。

昇思MindSpore开源社区技术委员会主席 金雪锋

其中,HyperOffload就像给模型训练“减负扩容”,让计算与状态分离,借助超节点的池化存储能力破解昂贵的HBM存储瓶颈,让片上内存变为缓存,内存池为存储,不仅让训练性能提升20%以上,更将推理序列长度拉长70%以上,提供更好的性价比。

HyperMPMD好比给算力分配“精准导航”,让并行模式从SPMD升级为MPMD,充分发挥超节点对等计算的优势,实现细粒度并行切分与通算并发,为强化学习、全模态等场景提供灵活、均衡的并行能力,将算力利用率提升15%以上。

HyperShard则是给开发者“松绑减负”,让并行编程从繁琐的命令式转为简洁的声明式,屏蔽超节点集群拓扑的复杂性,为全模态等模型提供极简组合编程体验,实现新算法并行化改造时间小于1天,并行策略调优也从天级缩减至小时级。

一言以蔽之,三重进化的昇思MindSpore为超节点而生,可加速Agentic AI、全模态等新模型结构和新训推范式创新,并为千行百业的大模型落地“降本提质增效”。

好用易用:“内外兼修”加速开发者AI创新进程

毋庸讳言,一切技术最终的价值,都要体现在应用落地上。为此,昇思MindSpore在持续开展技术摸高的同时,已在“内外兼修”全链路优化,为开发者打造好用易用的AI框架,加速他们的AI创新进程。

“内功”方面,昇思MindSpore通过框架的执行优化、自动微分、图优化、集群调优等能力,不断提升框架性能;并通过图模式AKG、并行寻优等组件间高度解耦,实现原子化开放,为昇思社区的广大开发者提供架构灵活、组件化可复用的AI框架。

在这个维度,昇思MindSpore在使能千行万业智能升级过程中,完善地支持超过25种不同系列大模型,携手2000+合作伙伴落地3100+行业应用实践,足以证明昇思已实现好用易用,给开发者提供丝滑的开发体验;而快速增长的社区下载量、贡献者及合入请求,则表明越来越多开发者已在社区实现“自闭环”,可以基于昇思MindSpore的创新技术做好模型创新。

“外功”方面,昇思MindSpore主动拥抱业界主流生态及社区,包括SGlang、vLLM、verl、Areal、openRLHF、LLama-factory、OpenCompass等,将解耦的组件能力使能三方主流开源社区,发挥核心AI框架能力,支持好其他头部社区生态的发展,并组织布道活动共同推动开发者应用创新。

在这个维度,昇思MindSpore已经全量支持vLLM社区核心特性对接,并且在一体机等关键领域场景形态下,不用修改代码就可以通过编译加速获得超过15%的性能收益;近期MindSpore框架的代码也已经正式贡献合入了SGLang社区主仓,丰富了社区后端生态的拓展,现已支持SGLang用户使用Mindspore在Qwen3和DeepSeek模型上开展高效部署。

全面进化:携手加速AI产业实践和科研创新

“两手抓、两手硬”之下,开源5年来的昇思MindSpore得到了全面进化,正携手行业伙伴及开发者面向下一个5年,共建更加繁荣的开源生态,进一步夯实AI框架这一产业智能化的核心基石,加速AI产业实践和科研创新。

在Al for Science领域,中国商飞上海飞机设计研究院基于昇思MindSpore AI框架持续创新,推出业界首个民机超临界翼型气动设计智能体——“御风·智翼”,构建了基于工程经验的超临界翼型智能一站式解决方案,实现设计效率与设计质量的双重提升,以AI突破科学计算边界,助力中国大飞机的新发展。

在大模型领域,面壁智能在基于昇思MindSpore构建分布式大模型训练引擎BMTrain的基础之上,研究打造更加高效的稀疏模型架构BlockFFN,实现以更少的参数激活量获得更强大的模型能力,提升模型密度,从而加快小尺寸模型在各种终端设备上的普惠落地,迎接通用人工智能时代的加速到来。

在金融领域,招商银行基于昇思MindSpore多维混合并行策略,在大规模的分布式运行链上开展多轮训练及微调,高效稳定地打造了金融领域的专家模型,并深度赋能公司的金融知识问答、业务模型定制等核心业务应用,推动银行业发展从传统的数字化银行转变为数智化银行。

在AI人才培养方面,北京师范大学结合产业对大模型的诉求,依托昇思MindSpore打造“课-训-赛-产”一体化AI人才培养全链条,赋能师生从知识学习者成长为昇思社区开发者和布道师,并在全国范围内开展实战型师资培训,培育AI教育种子力量,凝聚多方合力共建开放共赢的AI人才生态。

如此种种,昇思MindSpore全链路赋能大模型创新落地,并拉通“产学研”需求支持AI人才培养,已助力大量开发者成为AI产业发展的中坚力量,与时代共舞。

写在最后:

2025年,超节点成为业界AI基础建设的共识,支撑大模型持续创新。面向2026年,随着昇思MindSpore再进化,打造超节点时代AI框架的“最优解”,必将进一步加速新模型结构和新训推范式创新,支撑爆发在即的Agentic AI等新场景应用,让开发者基于昇思开展更多AI创新,赢在智能时代!