华为创始人任正非近期在接受访问时,发表了对芯片问题的独到见解。他表示,华为无需对芯片问题过度忧虑,通过“叠加与集群”等技术手段,华为的计算实力已能够与国际顶尖水平相抗衡。
在全球半导体竞争日益激烈,技术封锁愈发严峻的背景下,任正非的此番言论如同一针强心剂,引发了广泛关注。那么,面对芯片制程上的差距,华为的信心究竟源自何处?
任正非所提及的“叠加与集群”,本质上是通过系统级创新来弥补单个芯片性能的不足。集群计算通过将多块性能稍弱的芯片,通过高效的网络连接,协同完成复杂任务,从而形成强大的整体计算能力。华为的昇腾910B芯片便是其中的代表。尽管在制程上不及国际领先的3nm芯片,但通过自研的CCE通信协议,昇腾910B能够构建起高效的集群,支持盘古大模型的训练,其整体算力可媲美部分顶级GPU。
在“以量补质”的策略运用上,科技企业们不断探索创新。谷歌的TPU集群便是一个典型的例子。尽管TPU v4芯片的单片性能略逊于英伟达的A100,但谷歌凭借Cloud TPU集群的强大合力,成功训练出了拥有5400亿参数的PaLM模型。这充分证明,在人工智能等擅长并行处理的领域,集群计算的规模效应能够有效弥补单个芯片性能上的不足。
华为在算法优化方面的表现同样亮眼。任正非提出的“用数学补物理”理念,在华为的实践中得到了充分体现。华为采用稀疏计算、模型量化和剪枝等前沿技术手段,降低了对硬件性能的依赖。华为的MindSpore框架通过动态图优化和低精度计算,使得AI训练的计算需求降低了30%以上。这种软硬件协同优化的模式,让华为在制程相对较低的情况下,依然能够达成高效的计算效果。
天津港无人化码头的成功运营,便是华为这一优势的生动体现。数百块昇腾芯片组成的计算集群,在天津港无人化码头中发挥着“超级大脑”的作用。它实时处理海量传感器数据,精准指挥无人驾驶集卡和智能吊机。AI集群的出现,不仅提升了效率,降低了能耗,还让码头工人从高强度的体力劳动中解放出来。
AMD的崛起为华为提供了有益的借鉴。在2000年代,AMD曾被英特尔压制,但其CEO Lisa Su带领团队采用模块化设计和高效互联技术,推出Zen架构处理器,强调架构和生态而非单一制程。这一成功经验与华为聚焦5G基站和AI计算等特定场景,通过针对性优化使效率远超通用芯片的集群策略不谋而合。
Chiplet技术是任正非战略思想在工程实践中的生动体现。该技术通过架构革新和系统级优化,成功弥补了单个芯片制程上的代际差距,实现了整体性能的实用化突破。它跳出单一制程的限制,将复杂的大芯片拆解为多个功能明确的小芯粒,通过先进的封装技术,将这些异构芯粒集成在一起,从而在系统层面实现媲美甚至超越单一先进制程大芯片的性能和功能。
然而,Chiplet架构也面临着芯粒间高速、低功耗、高带宽互连的挑战。华为在高速SerDes、先进封装中的互连线设计等方面投入巨大,通过复杂的算法优化数据传输路径、降低噪声干扰,最大程度克服物理限制,确保多个芯粒能够高效协同工作。
人才与教育的长期投入是华为底气的根源。华为拥有约11.4万名研发人员,过去十年研发投入超过1.2万亿元。其“天才少年”计划吸引了众多顶尖人才,这些人才深入参与昇腾AI芯片的架构设计,将前沿的稀疏计算理念转化为芯片中的实际算力飞跃,奠定了华为在算力底层创新的核心竞争力。
尽管如此,挑战依然存在。集群计算在能耗、成本以及通信瓶颈等方面仍有待突破。但华为在集群计算、算法优化和生态协作等方面的深厚技术积累,以及对人才和教育的长期战略性投入,无疑为其在尖端科技竞争中增添了强大的底气。