Аналитик Zeitgeist заявил, что спрос на чипы памяти, используемые в искусственном интеллекте, на порядки превышает текущую глобальную производственную мощность, предполагая, что запасы производителей памяти могут вырасти в десять раз, если оценивать их не по историческим максимумам, а по реальным потребностям в вычислениях. Zeitgeist привел инвестиционный пример: 50 000 долларов, вложенные в акции Micron в сентябре прошлого года, сегодня стоили бы примерно 489 000 долларов. Аналитик связал дисбаланс спроса и предложения с фиксированными ограничениями высокоскоростной памяти (HBM) в AI-ускорителях и с быстрым внедрением AI-агентов, которые потребляют гораздо больше памяти за сессию, чем традиционные чатботы; этот сдвиг происходит на фоне более медленного масштабирования производства памяти по сравнению с ростом спроса.
AI-ускорители сталкиваются с фиксированными ограничениями по памяти
Каждый AI-ускоритель поставляется с фиксированным объемом высокоскоростной памяти, который нельзя расширить после развертывания. По словам Zeitgeist, стандартный чип H100 несет 80 ГБ HBM, более новые поколения предлагают до 192 ГБ, а будущий B300 будет иметь 288 ГБ. Именно этот потолок определяет, сколько запросов один ускоритель может обрабатывать одновременно.
Аналитик пояснил, что основная нагрузка по памяти идет не от весов модели, а от KV cache — сессионной памяти, которая растет с каждым сгенерированным токеном. Zeitgeist рассчитал, что одна сессия с контекстом на 128 000 токенов требует примерно 20 ГБ памяти, то есть всего четыре таких сессии полностью исчерпают ресурсы одного H100. Продвинутые модели, такие как Claude Opus 4.8 или GPT-5.5, по оценке аналитика, требуют от 40 ГБ до 100 ГБ для одного длительного запроса.
Аналитик оценивает 60-кратный дефицит памяти из-за внедрения агентов
Zeitgeist определил переход от простых чатботов к AI-агентам как ключевой драйвер спроса на память. Если обычный вопрос ложится на память с минимальной нагрузкой, то агент, который независимо вызывает инструменты и накапливает контекст, легко может достичь 100 000 токенов или даже больше. Аналитик рассчитал, что один сотрудник, который параллельно запускает десять таких агентов, потребует примерно 152 ГБ памяти.
Zeitgeist отметил, что в мире насчитывается примерно 250 миллионов сотрудников, занятых знаниями. Аналитик оценил, что при 100 агентных сессиях на человека в день миру потребуется примерно в 60 раз больше памяти, чем будет произведено в 2026 году. Zeitgeist признал, что новые методы внимания могут сократить расход памяти в 4–8 раз, но указал, что спрос растет быстрее, поскольку агенты вытесняют простые чаты, контекстные окна расширяются с 128 000 до 10 миллионов токенов, а AI-использование каждым работником смещается от нуля к сотням сессий.
SK Hynix обошла Samsung, когда спрос на AI-память резко вырос
Южнокорейский производитель памяти SK Hynix обогнал Samsung, став самой ценной котируемой компанией в стране, благодаря своей позиции в высокоскоростных чипах памяти, используемых для задач искусственного интеллекта. Zeitgeist заявил, что этот сдвиг поддерживает тезис о том, что производители памяти становятся крупными бенефициарами гонки за AI-инфраструктуру: компании, способные выпускать продвинутые чипы памяти, оказываются в положении, чтобы увидеть резкий рост выручки и оценок по мере того, как спрос на HBM растет быстрее предложения.
FAQ
Что аналитик Zeitgeist сказал о оценках акций производителей чипов памяти?
Zeitgeist заявил, что акции производителей памяти могут вырасти в десять раз относительно текущих уровней, если оценивать их по реальным потребностям в вычислениях, а не по историческим максимумам; он сослался на то, что спрос на AI-память на порядки превышает глобальную производственную мощность.
Сколько памяти требуется для сессии AI-агента по версии Zeitgeist?
Zeitgeist рассчитал, что одна сессия с контекстом на 128 000 токенов требует примерно 20 ГБ памяти, тогда как продвинутые модели, такие как Claude Opus 4.8 или GPT-5.5, требуют от 40 ГБ до 100 ГБ для одного длительного запроса. Аналитик оценил, что сотрудник, который запускает десять параллельных сессий агента, будет нуждаться примерно в 152 ГБ памяти.