华为CANN全量开源新路径：从自主构建到开放标准，AI算力生态迎变革-天脉财经

在华为中国合作伙伴大会的现场，记者与华为昇腾计算基础软件业务总经理李守平展开了一场深度对话。此次交流聚焦于CANN全量开源后，在超节点集群上部署万亿参数大模型时，软件层面如何达成更高算力利用率与更低时延这一关键问题。

李守平指出，CANN面对的是一个完整系统，涵盖计算、单元间连接等多个板块，实际涉及四个核心组件。要实现算力价值最大化，关键在于有效整合这些组件，进行系统性创新。他着重提到，华为超节点与业界传统集群有着本质区别。传统集群通常只是简单堆叠旧节点，而华为实现了统一内存、统一编址。从协议层面看，这一举措减少了数据包和开销，让底层负载大幅减轻。在上层，通过专家并行标准化设计，能够充分利用高带宽。即便万亿参数模型需要切分资源，也能充分发挥带宽优势，避免资源浪费。

华为在生态战略上的转变令人瞩目。过去，行业在国产替代方面，多处于“能否跑通CUDA代码”的被动防御状态，如同在别人的地基上修补房子。如今，随着CANN全量开源以及超节点协议主动开放，华为不再满足于产品“可用”，而是将底层技术定义权交还给社区。这表明华为战略重心从“构建自主能力”转向“共建开放标准”。事实证明，真正的竞争优势并非封闭的代码壁垒，而是全球开发者共同构建的协作网络。

李守平提及的“统一内存编址”和“协议层减负”，体现了用软件定义思维重塑硬件边界的理念。这与当年Linux对抗Unix的路径相似，当底层足够透明，上层应用创新便会迎来爆发。对于国内众多面临算力成本高、定制需求难以满足的AI初创公司而言，这或许是一个重要启示：与其在别人的领域修修补补，不如在自身领域深耕发展。

不过，华为面临的挑战依然不小。CUDA经过二十年积累，并非一次开源就能轻易超越。开发者习惯迁移、工具链完善程度等方面，都需要时间逐步打磨。但方向正确至关重要，当国产算力从“卖硬件产品”转向“卖技术能力”，从“兼容者”转变为“定义者”，AI基础设施领域的竞争才真正进入关键阶段。