天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

谷歌DiffusionGemma文本扩散模型发布:本地推理加速 性能与效率双突破

2026-06-11来源:快讯编辑:瑞雪

谷歌近日宣布推出一款名为DiffusionGemma的开放AI模型,该模型基于文本扩散机制构建,在本地推理速度上较传统自回归模型实现4倍提升。这一突破性进展为低带宽计算环境下的AI应用提供了新选择,尤其在需要快速响应的场景中展现出显著优势。

与传统自回归模型(如GPT系列)采用从左到右逐个生成Token的方式不同,DiffusionGemma通过扩散机制并行处理所有Token。该模型从随机噪声开始,逐步优化输出内容,这种并行计算模式大幅减少了内存带宽压力,特别适合本地设备运行。实验数据显示,其采样速度可达1479 Tokens/秒,单次生成开销仅0.84秒,在代码生成、数学推理等任务中效率提升尤为明显。

在性能评估方面,DiffusionGemma展现出不俗实力。代码生成任务中,LiveCodeBench得分30.9%,BigCodeBench达45.4%,Humaneval基准测试取得89.6%的成绩,与Gemini 2.0 Flash-Lite形成竞争态势。数学能力表现突出,在AIME 2025测试中取得23.3%的准确率,超越对比模型3.3个百分点。不过,模型在科学推理(GPQA Diamond 40.4%)和复杂推理(BIG-Bench Extra Hard 15.0%)任务中仍落后于主流模型,显示出架构优化空间。

开源策略方面,谷歌选择Apache 2.0许可证开放模型权重,用户可通过Hugging Face平台直接下载使用。尽管模型规模与Gemma 4系列相当,但其推理效率显著提升,且支持迭代优化机制——在生成过程中可主动检测并修正错误,输出稳定性较前代产品提高37%。这种特性使其在对话系统、实时翻译等需要低延迟的场景中具有应用潜力。

硬件适配性测试显示,DiffusionGemma能充分发挥英伟达GPU的并行计算优势。在单块H100 GPU上,模型实现每秒1000 Token的生成速度;DGX Spark集群环境下为150 Tokens/秒;DGX Station工作站更达到2000 Tokens/秒的峰值性能。这种效率提升主要得益于扩散架构与Tensor Core的深度协同,使得模型在保持精度的同时,计算资源利用率较自回归模型提高4倍。

行业分析师指出,该模型的推出标志着AI生成技术从序列处理向并行处理的范式转变。虽然当前版本在复杂推理任务中仍有局限,但其架构设计为后续优化提供了新方向。特别是对于移动端、边缘计算等资源受限场景,扩散机制可能成为突破性能瓶颈的关键技术路径。

摩尔线程发布开源代码大模型MusaCoder 性能领先行业助力GPU开发降本增效
IT之家 6 月 10 日消息,摩尔线程发布并开源面向 GPU 底层算子生成的专用代码大模型 MusaCoder,包含 9B 和 27B两个参数规模。 据悉,这是业内首个基于国产 GPU 算力底座完成全链路…

2026-06-11

中欧中证机器人指数发起A表现亮眼,成立以来收益超80%引关注
中欧中证机器人指数发起A成立于2024年1月17日,业绩比较基准为中证机器人指数收益率×95%+银行活期存款利率(税后)×5%。该基金成立以来收益80.45%,今年以来收益15.54%,近一月收益4.94%…

2026-06-11

中海达接待四家机构调研:全空间定位技术领航,智能驾驶业务迈向新高度
核心技术产品线涵盖高精度卫星导航定位、激光雷达、海洋探测、光电、导航控制五大领域,通过“技术-产品-解决方案”闭环,构建了从数据采集、要素处理到行业服务应用的全链路能力,致力于成为信息基础设施及服务供应商。其…

2026-06-11