谁在闷头做中国的Mythos 速度暴涨4倍【今日】_资讯_56之窗网手机版
原创文章
谁在闷头做中国的Mythos 速度暴涨4倍【今日】
2026-06-20 23:02  点击:8

别再只盯着“AO”两家的新模型大战了!谷歌刚刚发布了一款名为DiffusionGemma的新模型,这款模型将生成图片的扩散模型应用到了文字生成上,并实现了4倍加速。

谁在闷头做中国的Mythos

DiffusionGemma抛弃了传统的自回归模式,即逐个token生成的方式,而是采用类似“印刷机”的工作方式。它一次铺开256个token的“画布”,从随机噪声出发,通过多轮去噪,使整段文字同时浮现。这种新模式在生成速度方面表现出色:单块H100上每秒可生成1000多个tokens,在消费级RTX 5090上也能达到700多个tokens,比同规格自回归模型快了4倍。此外,这个26B参数的MoE模型在推理时只需激活3.8B参数,量化后仅需18GB显存即可运行,一张4090显卡就能本地跑。

谁在闷头做中国的Mythos 速度暴涨4倍

目前,DiffusionGemma采用了允许商用的Apache 2.0开源协议,权重可在Hugging Face直接下载。

谁在闷头做中国的Mythos 速度暴涨4倍

DiffusionGemma的最大优势在于其生成速度。在同一块H100上(fp8,batch size=1),DiffusionGemma的速度达到了1000+ tokens/s,而标准自回归的Gemma 4 26B A4B加上MTP加速也只有300+ tokens/s,速度差距近4倍。

你可能感兴趣
7分钟辅助!心悦填大坑破解器,都是有辅助教程(有挂细节)
第6分钟辅助!微信小程序挂件辅助,原来真的是有辅助工具(有挂总结
第三分钟辅助!越乡游义乌辅助器微信免费,总是真的是有辅助器(了解
1分钟辅助!中至九江麻将辅助器,确实存在有辅助教程(有挂实锤)
第7分钟辅助!微乐小程序多乐辅助器,都是存在有辅助插件(有挂透视
第3分钟辅助!开心泉州免费辅助器,确实是真的有辅助插件(有挂猫腻
六分钟辅助!嗨动互动辅助,一直真的有辅助插件(果真有挂)
第八分钟辅助!雀神广东麻将辅助工具,原来真的有辅助教程(有挂实锤
三分钟辅助!大唐麻将开挂软件,竟然真的有辅助软件(有挂神器)
第3分钟辅助!福建大玩家辅助透视,一贯真的有辅助脚本(有挂技巧)
第3分钟辅助!德友汇开挂脚本,原来是有辅助攻略(有挂细节)
第7分钟辅助!微乐小程序辅助多少钱,总是真的是有辅助挂(有挂总结