6月15日,算苗科技自主研发的3D TokenPU芯片A4E正式完成流片。这款专为AI大模型推理场景设计的云端大算力芯片,基于国产RISC-V架构,通过垂直堆叠存储与计算晶圆的技术创新,在算力密度与能效比上实现突破性提升,为行业提供了不依赖先进制程的算力升级新路径。
据技术团队介绍,A4E芯片采用8层存储晶圆与计算逻辑晶圆垂直堆叠设计,通过硅通孔(TSV)与凸点(bump)技术实现微米级互联,将传统芯片间毫米级数据传输距离缩短两个数量级。这种架构创新使访存带宽提升数十倍,有效缓解了大模型推理过程中因数据搬运效率低下导致的"数据饥饿"问题,特别适用于需要处理海量Token的生成式AI应用场景。
当前AI算力需求正呈现从训练向推理迁移的显著趋势。德勤研究显示,随着大模型应用深化,全球推理负载占AI算力的比例预计将超过80%。与此同时,开源RISC-V架构凭借其灵活性与可扩展性,正在数据中心及AI推理领域加速渗透,逐渐从边缘计算场景向核心算力基础设施延伸。
在智能汽车领域,算力分布与利用效率已成为关键竞争要素。车百智库报告指出,无论是电子电气架构升级还是智能驾驶方案迭代,都高度依赖云端算力支撑。相比车端芯片,云端服务器需要承担更复杂的模型训练任务与实时数据处理,对算力密度与能效比提出更高要求。3D TokenPU的技术特性使其在超节点服务器、大型智算中心等场景具有显著优势,同时也可满足金融等行业的私有化部署需求。
算苗科技创始人汪福全博士强调,3D TokenPU的研发突破了传统芯片设计范式。"我们通过架构创新而非单纯依赖制程进步来实现性能跃升,这种技术路线既符合国产供应链发展需求,也为全球AI算力竞赛提供了新选项。"据悉,该芯片已与多家头部大模型企业及智算中心展开合作测试,未来有望在智能汽车、金融科技等领域形成规模化应用。