天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

算苗科技3D TokenPU芯片流片,开辟AI推理新赛道助力云端算力升级

2026-06-18来源:天脉网编辑:瑞雪

近日,专注于3D架构AI云端大算力芯片研发的算苗科技对外宣布,其自主研发的3D TokenPU芯片A4E已于6月15日成功完成流片。这款芯片专为满足大模型推理需求而设计,基于自研的RISC-V架构,并采用成熟的国产工艺制造,旨在实现推理场景下的极致性能与更低的总拥有成本(TCO)。

算苗科技创始人兼CEO汪福全,同时也是中科院声学所国家重点实验室的博士,在接受采访时表示:“我们并非在既有的赛道上追赶,而是致力于开辟全新的方向。3D TokenPU专为大模型的Token处理而设计,无需过度依赖制程的缩小,就能实现算力密度和能效比的显著提升。”

A4E芯片的一大创新在于其存储与计算架构。它将8层存储晶圆垂直堆叠在计算逻辑晶圆之上,通过硅通孔(TSV)与凸点(bump)技术实现微米级的互联。这一设计将传统芯片间毫米级的传输距离大幅压缩,带来了超大的访存带宽,有效缓解了大模型推理过程中因数据搬运效率低下而导致的“数据饥饿”问题。

当前,AI算力的需求正逐渐从训练侧向推理侧转移。据德勤预测,长期来看,全球推理负载在AI算力中的占比有望超过80%。与此同时,开源的RISC-V架构正从“备选”逐渐走向“主流”,在数据中心及AI推理等场景中加速渗透。

车百智库的报告也指出,无论是电子电气架构还是智能驾驶解决方案,都高度依赖算力的合理分布与高效利用。算力已成为智能汽车的核心要素。与车端计算芯片相比,云端芯片需要承担更为复杂的训练任务和海量数据处理,因此其算力更为强劲。

据算苗科技的技术人士介绍,3D TokenPU目前主要面向云端大算力AI推理场景,可应用于头部大模型公司的超节点服务器、大型智算中心服务器,以及部分金融等专业领域需要私有化部署到本地的场景。随着汽车智联、智驾功能的日益普及,许多智能化处理同样需要通过云端服务器完成,其中就会涉及云端AI服务器,因此3D TokenPU这类推理芯片也将有机会在这些领域得到应用。

家电ETF华夏515640开盘上扬3.04%,美的格力微涨,重仓股表现分化
来源:新浪基金∞工作室 6月17日,家电ETF华夏(515640)开盘涨3.04%,报1.016元。家电ETF华夏(515640)重仓股方面,美的集团开盘涨0.01%,格力电器涨0.11%,三花智控跌0.93…

2026-06-18

石头科技股价下跌1.21% 主力资金净流出 今年以来股价跌幅超三成
截至3月31日,石头科技股东户数2.40万,较上期增加10.70%;人均流通股10815股,较上期减少9.66%。 机构持仓方面,截止2026年3月31日,石头科技十大流通股东中,香港中央结算有限公司位居第…

2026-06-18

刚被SpaceX收购的Cursor发布新模型:1.5万亿+参数,10万块GPU预训练
在他看来,Google 的模型规模没有推到同等水平,同时在稀疏化路线上走得过于激进,后训练和强化学习能力也还没有充分转化为稳定、好用的产品体验。 这意味着模型需要会使用工程师常用的工具,能做规划,能测试软件,…

2026-06-18

中国电信“星海”赋能 筑牢数据安全防线护航数字经济新发展
作为国内信息通信行业的“国家队”,中国电信在数据安全领域构建了以“云网融合”为底座,涵盖合规治理、技术防护、流通服务、人才建设的全方位安全体系,全方位守护数据流通。通过全生命周期数据管控、分布式可信计算、…

2026-06-18

国产大模型 GLM-5.2 体验:编码实力能打,多模态与算力短板待补
第二个问题是模型的上下文长度只支持到了 256k,这就导致但如果你用它干点稍微复杂的活,上下文一被塞满,模型的能力就会有所下降。 当然,跑分再高也只能做个参考,为了看看它是不是一个只会刷题的小镇做题家,世超…

2026-06-18