谷歌推出压缩算法 实现约6倍内存节省【今日】_资讯_56之窗网手机版
生活焦点
谷歌推出压缩算法 实现约6倍内存节省【今日】
2026-03-27 23:04  点击:1

谷歌近日推出了一种新的压缩算法TurboQuant,旨在降低人工智能系统的内存需求。该算法特别针对大语言模型和向量搜索引擎中的键值缓存瓶颈问题。随着上下文窗口的增大,这些缓存成为主要的内存瓶颈。TurboQuant可以在无需重新训练或微调模型的情况下,将键值缓存压缩至3比特精度,并且基本保持模型准确率不受影响。

测试结果显示,TurboQuant对包括Gemma和Mistral在内的开源模型实现了约6倍的键值缓存内存压缩效果。在英伟达H100加速器上的测试中,与未量化的键向量相比,该算法最高可实现约8倍的性能提升。研究人员表示,这项技术不仅适用于AI模型,还能增强大规模搜索引擎的向量检索能力。谷歌计划在2026年4月的国际学习表征会议上展示这一技术。

你可能感兴趣
据文件显示!大当家辅助脚本下载,hhpoker辅助软件是真的么,手段教
最终!欢乐茶馆免费辅助设置,衢州都莱破解器,妙计教程(一直确实有
据相关数据显示!微信九游大厅辅助,福建天天开心辅助工具下载,窍门
据玩家消息!哥哥打大a外卦辅助工具,浙江宝宝游戏辅助工具,操作教
出乎意料的是!福麻圈辅助,丰城呱呱辅助器,机巧教程(一直确实是有
截至发稿!途游游戏辅助工具,天蝎大厅辅助,演示教程(一贯确实是有
三部门提醒:“人民币版”冥币不要用 典型案例曝光【今日】
海南旅游业迎爆发式增长 入境游客激增【今日】
U23国足球员彭啸喊出球队目标 争取全取6分胜利【今日】
工行总资产突破53万亿 成为全球首家超50万亿银行【今日】
男子一人分饰多角诈骗老人 自导自演“假死”戏码【今日】
山东“5·27”重大爆炸事故原因公布 多环节失职导致悲剧【今日】