NAND顆粒芯片,是目前SSD中最爲常見的存儲介質,對於民用消費級而言,最快的PCIe5.0 SSD速率已經達到了15GB/s,這個速度已經是非常快了。但是對於AI推理服務器來說,即使是最新的PCIe 6.0 SSD,速率高達28GB/s都不夠用。
目前的AI推理服務器主要依賴HBM處理數據,雖然HBM有着極快的速度但是容量非常有限,並且成本非常昂貴,當處理超大模型時,一旦HBM容量不足以容納全部數據,就不得不與SSD或系統DRAM交換數據,從而造成性能上的瓶頸。
於是,存儲巨頭SK海力士與閃迪宣佈聯手推出新的高帶寬閃存HBF標準。二者於2026年2月25日正式啓動HBF的全球標準化進程。其核心目標是填補HBM與SSD之間的性能與容量斷層,解決大模型AI推理的內存瓶頸。

HBF並非是HBM的替代品,而是介於HBM和SSD之間的全新層級。容量上比HBM大得多(8-16 倍),帶寬又遠高於SSD的中間層,同時成本上還比HBM低得多。它可以直接與AI服務器緊密集成,就像一個超大容量的“近處理器緩存”,讓服務器能快速訪問海量數據,減少等待SSD的時間。

在技術原理上,HBF本質上還是基於NAND閃存,而非HBM所屬的DRAM。通過BiCS路線圖中的CBA技術和專有3D堆疊技術,以做到類似HBM4的物理尺寸和功耗,從而實現在硬件接口上完全兼容HBM。服務器佈局無需做大規模修改,即可直接實現HBM+HBF的混合部署,甚至全部替換爲HBF,硬件改造成本極低。

第一代HBF預計最高可達1.6TB/s的讀取帶寬,16芯片堆棧,總容量可高達512GB。根據閃迪的內部測試顯示,在Llama 3.1 405B模型中與無容量限制的HBM性能差距可控制在 2.2% 以內。一旦成功落地並獲得廣泛應用,HBF可能成爲破解當前AI算力內存瓶頸的關鍵拼圖。而對於普通消費者而言,HBF的應用也許會減少對HBM的產能依賴,長遠看或許有助於提升DRAM內存的產能。




