行业资讯

时间:2025-08-04 浏览量:(67)

昇腾 CANN:以开放与创新,重塑 AI 产业格局

在 5 月 23 日举办的 “鲲鹏昇腾开发者大会 2025” 上,华为昇腾计算业务总裁张迪煊围绕 “一起昇腾 共绽光芒” 的主题,深入解读了昇腾 AI 的技术战略与生态布局。其中,昇腾异构计算架构 CANN(Compute Architecture for Neural Networks)作为昇腾 AI 的核心软件平台,尤为引人注目。它始终坚守 “使能每一位创新者” 的目标,坚持深度开放策略,不断进行技术创新,力求释放硬件的极致潜能,推动 AI 开发效率与性能实现双重突破。本次大会带来了一系列重磅技术升级,通过构建全面开放的创新生态与具备极致效能的算力底座,携手全球开发者加速 AI 技术向千行万业渗透,重塑产业创新范式。

生态构建,开发者赋能:从人才培养到生态共建,激活产业创新活力

昇腾 CANN 以 “使能每一位创新者” 作为核心理念,自 2023 年宣布深度开放以来,通过多维协同创新构建起开发者友好型 AI 生态。目前,由 6000 + 认证开发者组成的创新社区正源源不断地释放技术势能。截至当下,已携手互联网、运营商、金融等 30 多个领域的伙伴,共同创新开发出 260 多个高性能算子,极大地提升了业务场景的性能表现。


在技术创新方面,CANN 成果斐然。在操作系统层面,打造多样化 OS,与鸿蒙、欧拉等系统兼容,为开发运行筑牢根基。CANN 将算子加速库、通信算法、Ascend C、集合通信库等组件开源,在 Gitee 社区上线了 260 + 算子、10 + 通信算法参考样例,大幅提升了开发效率。在整图优化上,提供内存复用、自动调度等加速技术,显著加速模型计算效率。


这种 “基础层开放 + 应用层共创” 的双轮驱动模式,不仅重新界定了 AI 算力效能的边界,更有力地推动了 AI 产业链的协同进化,成功形成从技术突破到商业转化的生态闭环。

深度开放再升级:分层架构匹配多元开发场景,开发效率显著提升

在 AI 开发效率成为产业竞争关键因素的当下,昇腾 CANN 借助分层开放架构实现了技术普惠化的重大跨越,构建起覆盖算子开发、系统调优到编译链优化的全场景赋能体系,达成了 “效率与性能兼得” 的开发体验升级:


  • 最佳实践赋能,降低开发门槛:发布 CATLASS 算子模板库,分层提供 Device 层调用接口、Kernel 层完整实现及 Block/Tile/Basic 层拆解源码,将 Matmul 开发周期缩短至原来的 50%;开源 Ascend C 2.0 并提供丰富开发接口,结合算子加速库(AOL)与集合通信库(HCCL),搭配 Gitee 社区参考样例,助力开发者迅速完成算子开发与调优。

  • 开放底层原子能力,释放极致性能:开放 190+ runtime 运行时接口,提供底层原子级能力,支持灵活组合,让开发者能够直接调用 NPU 硬件的原子级能力,实现整图调度优化,挖掘硬件性能极限。

  • 毕昇编译器构建开放生态,兼容主流开发体系:毕昇编译器以 “全链路优化 + 生态兼容” 为核心,打造开发者友好型工具链。在编译优化方面,前端支持异构混合编程,中端优化使算子性能提升 20%+,后端能在分钟级定位内存问题;在生态开放层面,开放 AscendNPU IR 接口,为开发者带来 “无感迁移” 的开发体验,同时通过开源社区持续输出技术能力,推动昇腾与全球 AI 开发生态深度融合。在生态建设过程中,通过毕昇编译器的升级与开放,实现与 Triton、FlagTree 等第三方编程框架的无感对接。

昇腾 CANN 核心技术引领:计算 - 内存 - 通信 “三驾马车” 重构 AI 算力基因

随着 AI 技术的持续突破,模型优化技术从 “模型结构创新” 拓展到 “训推全流程” 算法创新,从模型层面的算法优化,深入到对底层硬件资源的极致利用。CANN 是充分释放处理器极致性能的关键所在,今年昇腾在计算加速、通信加速、内存优化三大领域协同发力,持续释放硬件价值,创新加速技术,以满足前沿模型架构及工程创新的发展需求。


  • 计算优化领域:通过 MLAPO 融合算子技术,将 MoE 模型中的 13 个串行小算子整合为超级大算子,结合 Vector 与 Cube 计算单元并行处理,使计算耗时从 109ms 锐减至 45ms,性能提升超 142%,充分释放了硬件计算潜力。

  • 通信效率突破方面:NPUDirect 通信算法革新了传统 RDMA 异步通信模式,实现 “单消息一次同步” 机制,使小包通信耗时降低 90%,整网通信时延减少 50%,在大规模 MoE 模型推理中极大地提升了数据传输效率。

  • 内存管理维度:创新的多重地址映射技术动态切分物理内存适配虚拟地址,有效拼接不连续空闲内存,将内存利用率提升 20% 以上,成功破解动态 shape 场景下的碎片难题。


三大技术的协同突破,构建起昇腾 CANN“计算高效、通信敏捷、内存精细” 的底层技术体系,为 AI 模型训推全流程提供极致算力支撑,引领 AI 基础设施性能实现跃迁。


从分层开放引发的生态裂变,到计算 - 内存 - 通信的原子级突破,昇腾 CANN 正以 “技术纵深的突破与生态广度的延展” 双轮驱动,重塑 AI 产业的创新范式。这不仅是一场硬件算力的革命,更是开发者与技术的共同进化。在这场气势恢宏的算力跃升征程中,昇腾 CANN 不仅是中国 AI 创新的技术底座,更是全球开发者突破想象边界的广阔天地 —— 以开放之姿,与时代共昇腾;以极致之力,与未来共绽放。


Search Bar

最新资讯

2025-08-26

高防服务器 TCP/UDP 协...

2025-09-02

云负载均衡:定义、优势、原理与...

2025-08-22

网络存储器(NAS)选购指南:...

2025-08-13

服务器站群与宝塔 Linux ...

2025-08-14

网站服务器遭受 DDoS 攻击...