行业资讯

时间:2025-08-04 浏览量:(59)

AI 竞争焦点转移:从拥有到运用

在当下,随着 DeepSeek 的广泛部署,企业关注的重点已从能否获取 AI,悄然转变为如何高效运用 AI。相较于能否接入 DeepSeek,如何将其用好用精,已然成为企业在激烈市场竞争中脱颖而出的关键因素。
DeepSeek 通过大幅削减大模型的部署成本,有力推动了各行各业 AI 应用的蓬勃发展。国家数据局发布的数据显示,2024 年初,中国日均 Token 消耗量为 1000 亿,而到了今年 3 月,这一数字已跃升至 10 万亿级别,仅仅一年时间,增长幅度高达 100 倍。
越来越多的企业将 DeepSeek 等深度推理模型应用于生产实践,使得算法层面的差距逐渐缩小。于是,各行业的 AI 竞争焦点,从单纯的 “有无 AI”,过渡到了 “AI 运用水平的高低”。步入 2025 年,模型优化技术不再局限于模型算法本身,而是深入到对底层硬件资源的充分挖掘与极致利用,一场围绕底层软硬件协同效能的深层次竞争,正悄然拉开帷幕。
在 AI 基础设施领域,连接底层硬件与上层 AI 框架的计算架构,成为了下一阶段 AI 落地应用的核心要素。其中,深度开放的昇腾计算架构 CANN,正逐渐成为推动产业 AI 高效落地的重要力量。

趋势转变:AI 竞争深入 “系统效能” 核心地带

DeepSeek 模型之所以能够领先,背后依托的是一系列先进的模型结构优化技术,例如 MoE、动态稀疏计算、自适应参数优化、多头潜在注意力机制(MLA)、无辅助损失的负载均衡技术,以及多词元预测训练方法等。这些技术创新成功打破了 AI 训练成本高昂的困境,以 GPT-4 百分之一的成本,实现了与之相近的性能表现,同时进一步降低了 AI 应用的门槛。
所有接入 DeepSeek 的企业,均可直接受益于这些先进的模型结构优化技术。然而,若要将这些技术的优势发挥到极致,进一步提升推理效率,则必须依赖于底层资源的系统性优化。这就涉及到计算产业的关键 —— 计算架构。
若将 AI 技术栈比作一座多层建筑,自下而上分别为:XPU 硬件层、驱动层、计算架构层、AI 框架层、AI 模型层以及 AI 应用层。计算架构在其中起着承上启下的关键作用,向下能够兼容 GPU、NPU、XPU 等多种异构处理器,向上则可对接主流 AI 框架,是充分发挥底层硬件计算能力、推动前沿开发的重要平台。
尽管底层计算架构与上层 AI 应用看似相距甚远,但实际上,计算架构却是未来各行业在 AI 应用效率方面一决高下的关键所在。计算架构犹如建筑的根基,只有根基打得足够牢固、足够深入,才能支撑起更为宏伟、稳固的上层建筑。
在全球计算产业领域,有能力研发计算架构并逐步构建生态系统的企业屈指可数。计算架构通常涵盖编程语言、算子库、编译器等核心组件,以及围绕这些组件展开的大量底层优化技术,每一项都需要投入巨额的研发资金,才能持续保持技术领先地位。
在全球 AI 版图中,昇腾已成为一股不可忽视的创新力量。昇腾异构计算架构 CANN(Compute Architecture for Neural Networks),正是昇腾 AI 的核心软件平台。
一方面,CANN 能够充分挖掘底层昇腾全系列硬件的潜力,将其性能发挥到极致,显著优化顶尖模型的性能表现,加速 AI 在各行各业的落地应用。
另一方面,通过深度开放战略,CANN 为深度 AI 开发者提供了广阔的创新空间,携手合作伙伴不断探索模型性能的极限,成为汇聚 AI 产业创新活力的重要引擎。随着与全球 AI 产业链的深度融合,CANN 深度开放战略的价值正不断凸显并持续放大。

软硬协同与分层开放:攻克行业 AI 落地难题

面对各行各业复杂多样的 AI 应用场景,当基于上层算法优化的模型性能提升已趋近极限时,计算架构在进一步提升推理效能方面,仍具有巨大的创新潜力。目前,昇腾 CANN 已探索出一套完整的底层资源优化策略与方法体系,能够显著提高算力利用效率和模型运行效率,并已在互联网、运营商、教育科研、制造等多个行业取得成功实践。

针对极致性能与超低时延场景的底层资源综合优化

在 AI 应用过程中,企业对于高性能、低时延的追求永无止境,尤其是在用户数量庞大、业务呈现高吞吐高并发特点的互联网和运营商等行业。通过对硬件资源的三个关键部分 —— 计算、通信、内存进行优化,CANN 能够大幅提升底层资源的利用效率。
在计算环节,多头潜在注意力(MLA)的前处理阶段涉及 20 次数据搬入搬出以及 13 个算子的串行计算。CANN 创新性地提出了 MLAPO 融合算子技术,将众多小算子整合为一个大算子,使得计算耗时从 109 微秒缩短至 45 微秒。该技术已在头部互联网企业和运营商客户中得到应用,为其带来了 20% 的性能提升。
在通信环节,MoE 模型涉及专家之间大量的数据通信。CANN 通过 NPU Direct 通信算法创新,将通信时间消耗相较于传统 RDMA 异步通信降低了 90%。这一技术帮助科大讯飞星火大模型的跨机通信时延大幅降低 90%,同时使中国移动的千卡集群通信效率提高了 50%。
在内存环节,CANN 自主研发的多重地址映射技术,通过对碎片内存进行重组,实现了内存利用率提升 20% 的效果。

针对 AI 前沿开发领域,CANN 通过分层开放解决开发效率与适配难题

教育和科研行业是 AI 前沿开发的主力军,但常常面临开发效率低、异构资源适配困难等问题。普通开发者通过简单调用算子库,即可满足一般性开发需求。然而,对于更为前沿、深入的开发需求,则需要计算架构不断开源开放来实现。
分层开放是 CANN 的重要技术策略之一。在开源了 Ascend C 编程语言、AOL 算子加速库、HCCL 集合通信库之后,今年 CANN 进一步开源 GE 图引擎,开放毕昇编译器和 Runtime 运行时,以满足开发者对于极致开发的需求。清华大学计图团队基于 CANN 构建了 MoE 专用的算子体系,率先在昇腾单台服务器上成功部署 DeepSeek R1 模型。
此外,CANN 持续迭代的重点之一,是提供成熟的工具以提升开发效率。今年,CANN 新推出了 CATLASS 算子模板库,其中包含丰富的算子样例。华南理工大学团队借助 CATLASS 算子模板库开发 Matmul 算子,开发周期从传统的 4 人周缩短至 2 人周。

针对传统行业本地化部署 AI 困难的问题,CANN 联合伙伴加速行业解决方案落地

对于制造、医疗等传统行业而言,DeepSeek 的落地应用仍存在一定障碍。以 DeepSeek 一体机、垂直行业大模型等为代表的解决方案,能够简化部署流程,加速 AI 在传统行业的应用推广。昇腾携手合作伙伴推出了丰富多样的 DeepSeek 解决方案,目前已在 500 多家行业客户中得到应用。
例如,在家纺行业,传统的画稿设计流程繁琐,严重制约了新品研发效率。过去,从设计师手绘、面料挑选、样本制作到样品拍摄,整个过程耗时超过 20 天,且需要反复修改,成本高达数万元。昇腾的合作伙伴纺知云科技,基于 CANN 的深度开放能力和 DeepSeek 的底层技术,研发出国内首个家纺大模型。设计师只需输入简单的图片和描述,该大模型就能自动生成兼具美学与商业价值的样品设计,将设计成本降至几十元,设计周期缩短至 5 天。

生态开放:汇聚 AI 全产业链创新动力

随着 AI 技术的快速迭代更新,AI 产业链上下游变得日益庞大和复杂,绝非个别科技巨头能够独自掌控。开放的深度与广度,已成为计算架构的核心竞争力所在。对于 CANN 而言,深度开放既是技术策略,也是生态战略。借助深度开放,CANN 正逐步成为汇聚 AI 全产业链创新力量的关键引擎。

与伙伴共同构建覆盖 AI 落地全生命周期、更开放易用的 AI 基础设施生态

在算子开发方面,基于 CANN 的深度开放能力,高性能算子库已助力 30 多家客户和合作伙伴开发了 260 多个核心算子。这些核心算子能够适配更广泛的行业场景,进一步降低了企业应用 AI 的门槛。
在操作系统方面,CANN 与鸿蒙、欧拉、麒麟等五大国产系统实现了深度兼容。
在模型训练与部署方面,CANN 赋能腾讯、硅基流动、无问芯穹等 10 多家 AI 基础设施企业,共同打造智能调度引擎、分布式训练框架等创新套件,使 AI 落地应用更加高效。

与伙伴联合研发,共同推动基础模型的前沿创新

近年来,基础模型的性能突破与底层资源优化呈现出相互促进的发展态势。
以昇腾与科大讯飞的深度合作为例,一方面,计算架构加速了对模型性能的深度探索。基于深度开放的 CANN,科大讯飞率先在昇腾平台上实现了 MoE 模型的训练与推理应用,在昇腾集群上首次成功验证了 MoE 模型的大规模专家并行推理,整体吞吐率提升 3.2 倍,端到端时延降低 50%。
另一方面,模型性能的突破也推动了底层软硬件协同的优化。科大讯飞深度参与昇腾软件生态建设,促使昇腾开发工具集的特性不断丰富。

持续强化与 Pytorch、vLLM 等全球主流 AI 开源生态的合作

近年来,昇腾不断加强与第三方开源生态的合作,深度融入全球 AI 开源生态体系。目前,vLLM 已成为深受开发者喜爱的推理引擎之一。2024 年下半年,昇腾与 vLLM 开启技术与生态合作,vLLM 社区新版本发布时即支持昇腾,为开发者提供了更多选择。昇腾团队还协助 vLLM 社区开发了硬件后端的插件化特性,降低了社区对后端支持的维护成本。

结语

当模型性能突破与底层资源优化紧密交织,计算架构已从技术幕后走向产业前台。
从架构师不断优化的代码,到实际业务场景中的降本增效,CANN 已在各行各业的 AI 竞争中发挥着举足轻重的作用。
在企业 AI 应用迈向深入的当下,开放创新的 CANN,正逐步成为自主可控 AI 产业链的中流砥柱。


Search Bar

最新资讯

2025-08-05

香港中小企选服务器必看:影响网...

2025-09-02

美国云服务器与 HPC:特性对...

2025-08-14

如何选择合适配置的海外服务器

2025-08-27

SSL 加密流量下的 DDoS...

2025-08-22

网络存储器(NAS)选购指南:...