Menurut Citrini Research, pada 16 Juni, AMD dan Apple secara bersamaan mengembangkan alternatif berbasis flash-memory untuk DRAM dalam produk AI. AMD mengakuisisi MEXT untuk mengoptimalkan performa flash storage mendekati level DRAM, sehingga menurunkan biaya memori pusat data; Apple menerapkan teknologi “LLM in a flash” untuk mencapai optimasi serupa di sisi perangkat.
Riset terbaru Citrini menunjukkan bahwa kebutuhan KV cache pada inferensi AI dan penggunaan HBM yang menghabiskan 25% kapasitas produksi DRAM menciptakan tekanan biaya memori yang signifikan. Flash storage hanya menelan biaya 1/55 dibanding DRAM, dan melalui optimasi controller, NAND stacking, serta penyesuaian cell mode, ia menawarkan alternatif kapasitas dan bandwidth yang layak untuk edge AI.