Según Citrini Research, el 16 de junio, AMD y Apple están impulsando simultáneamente alternativas basadas en memoria flash a DRAM en productos de IA. AMD adquirió MEXT para optimizar el rendimiento del almacenamiento flash a niveles cercanos a DRAM, reduciendo los costos de memoria de los centros de datos; Apple implementó la tecnología de “LLM in a flash” para lograr una optimización similar en el borde del dispositivo.
La última investigación de Citrini indica que las demandas de KV cache en la inferencia de IA y el uso de HBM que consume el 25% de la capacidad de producción de DRAM generan una presión significativa sobre los costos de memoria. El almacenamiento flash tiene un costo de solo 1/55 en comparación con DRAM y, mediante la optimización de controladores, el apilamiento NAND y los ajustes del modo de celda, ofrece alternativas viables de capacidad y ancho de banda para la IA en el borde.