谷歌TurboQuant技术将AI内存需求降低6倍

张开发
2026/4/4 1:46:47 15 分钟阅读
谷歌TurboQuant技术将AI内存需求降低6倍
内存价格正在暴跌内存公司股价崩盘起因是谷歌研究院发布了一项突破性技术能够大幅减少AI处理所需的内存。AI不仅以高计算要求著称内存需求同样巨大。处理大语言模型和执行推理需要大量内存这导致市场上可用内存严重短缺因为AI数据中心吞噬了所有供应。谷歌研究院推出了TurboQuant这是一种针对大语言模型和向量搜索引擎的压缩算法可能大幅降低AI内存需求。据谷歌表示TurboQuant通过将AI模型的内存使用量减少6倍缓解了主要的推理内存瓶颈在相同GPU数量下速度提升8倍同时保持零精度损失重新定义AI效率。谷歌在X平台宣布TurboQuant后社交网络立即炸锅。人们开始下载早期版本代码并进行测试发现它确实兑现了承诺。大型内存芯片制造商股价下跌美光科技股价在两周内暴跌超过100美元从3月中旬的467美元跌至几天后的366美元尽管公平地说整个市场同时都在震荡。这也对内存定价产生了重大影响。台湾经济日报报道DDR5内存条价格在过去几周内下跌15%至30%这是内存价格一段时间以来的首次下降。市场上一次见证如此震荡还是中国的DeepSeek但人们很快对其效力产生怀疑。开发者发现DeepSeek的效率提升需要深度架构决策必须从一开始就内置。TurboQuant不需要重新训练或微调理论上可以直接投入现有推理管道。如果它能在生产系统中无需改装就运行那么数据中心运营商将在现有硬件上获得巨大性能提升。数据中心运营商不必为解决性能问题而增加硬件投入。然而分析师呼吁在得出结论前要谨慎。DellOro集团物理基础设施研究总监Alex Cordovil说这是一项研究突破不是发货产品。发表的论文与现实世界推理工作负载之间往往存在有意义的差距。此外DellOro的基本观点仍然是AI计算的效率提升往往会被更多需求所消耗这被称为杰文斯悖论。任何释放的容量可能会被前沿模型扩展能力所吸收而不是减少硬件占用空间。客观分析公司总裁Jim Handy同意第二部分观点。他说超大规模云服务商不会削减支出他们只会花同样的钱获得更多价值。数据中心不是要达到某个性能水平然后停止在AI上的支出。他们要通过超支对手来获得市场主导地位。这不会改变这一点。谷歌计划在4月23日至27日在里约热内卢举行的ICLR会议上提交概述TurboQuant的论文。QAQ1TurboQuant是什么技术有什么优势ATurboQuant是谷歌研究院开发的一种针对大语言模型和向量搜索引擎的压缩算法。它能将AI模型的内存使用量减少6倍在相同GPU数量下速度提升8倍同时保持零精度损失不需要重新训练或微调。Q2TurboQuant对内存市场产生了什么影响ATurboQuant发布后内存价格暴跌DDR5内存条价格在过去几周内下跌15%至30%。大型内存芯片制造商股价也大幅下跌美光科技股价在两周内暴跌超过100美元。Q3TurboQuant能否在实际生产中广泛应用A分析师认为需要谨慎对待。这目前还是研究突破而非发货产品发表论文与现实应用之间往往存在差距。即使技术成熟效率提升可能会被更多AI需求消耗而不是减少硬件投入。

更多文章