NVIDIA открывает долгосрочного партнёра по ИИ Deepinfra — 107 млн долларов серии B для создания «фабрики токенов»

GLM-1,35%

AI компания DeepInfra объявила о завершении раунда B на 1,07 млрд долларов США, который возглавили 500 Global и ранний инженер Google Georges Harik; также в раунде приняли участие стратегические инвесторы, включая NVIDIA (Нвидиа), Samsung Next и Supermicro. Как сообщается в официальной информации, полученные средства будут направлены на расширение мощностей глобальных дата-центров, чтобы решить текущие вычислительные затраты и узкие места по эффективности, возникающие при переходе ИИ-приложений с этапа «обучения моделей» к «крупномасштабному инференсу».

Спрос на AI-инференс резко растет и становится ключевым узким местом при развертытывании в компаниях

По мере движения ИИ к коммерциализации фокус рабочих нагрузок в компаниях заметно смещается. DeepInfra отмечает, что с момента раунда A объем токенов, обрабатываемых на ее платформе, вырос в 25 раз, что показывает: Inference (инференс) уже стал основной движущей силой корпоративных ИИ-нагрузок. При этом текущая эффективность открытых моделей уже сопоставима с проприетарными системами, что существенно снижает порог для инноваций. Однако вслед за этим встают сложности с применением автономных интеллектуальных агентных систем (Agentic Systems): один сценарий может требовать включения сотен вызовов модели. Поскольку традиционные универсальные облачные платформы не были разработаны под требования инференса, компании сталкиваются с слишком высокими операционными затратами и с неконтролируемыми задержками — поэтому инференс становится системным ограничением для рабочих нагрузок.

Вертикальная интеграция: оптимизация токенной экономичности стека

DeepInfra придерживается стратегии вертикальной интеграции и утверждает, что высокоэффективный инференс должен обеспечиваться согласованным проектированием аппаратного обеспечения, сети и программного слоя. Команда в прошлом имеет опыт разработки глобальных коммуникационных приложений imo с эксплуатацией распределенных систем на 200 млн пользователей. Сейчас она уже основала в США восемь GPU-инфраструктур. По сравнению с сервис-провайдерами, которые арендуют мощности у третьих сторон, DeepInfra имеет полный контроль над стеком — от уровня чипов до API-интерфейса. Такое проектирование позволяет оптимизировать задачи генерации токенов «всегда онлайн» и гарантировать, что при выполнении рабочих нагрузок интеллектуального AI компания сможет обеспечить лучшую предсказуемость задержек, чем в универсальной облачной среде.

Deepinfra — ранний инфраструктурный партнер NVIDIA для открытой AI-экосистемы

Deepinfra является партнером раннего этапа по развитию инфраструктуры открытой AI-экосистемы NVIDIA: она поддерживает режим Nemotron, архитектуру агентных систем NemoClaw и инференсное ПО NVIDIA Dynamo. Раннее развертывание GPU Blackwell, а также предстоящая интеграция Vera Rubin и Dynamo, позволят повысить эффективность «стоимость инференса» до 20 раз.

Deepinfra предлагает конкурентоспособные открытые модели

В части контроля затрат DeepInfra за счет оптимизированной эксплуатации аппаратных средств обрабатывает более 190 открытых моделей, стремясь предложить рынку цены, которые будут очень конкурентными. В качестве примера открытой инференс-модели GLM-5: ее смешанное ценообразование составляет 1,24 доллара США за миллион токенов, что примерно на 20 % ниже средних значений по отрасли. Для «моделей мышления», которым требуется большой объем вычислений внутренних токенов, платформа разработала механизм кэширования: для статического текста при повторном вводе применяется сниженная цена, что позволяет существенно уменьшить расходы на многоходовые диалоги и конвейеры генерации с усилением выборкой (RAG). Чтобы соответствовать требованиям безопасности со стороны корпоративных клиентов, DeepInfra предоставляет API, совместимые с OpenAI, и обещает отсутствие хранения данных; также она проходит сертификацию SOC 2 и ISO 27001, гарантируя разработчикам возможность напрямую применять модели в производственных средах.

Значимость специализированной инференс-инфраструктуры для следующего этапа развития ИИ

Поддержка DeepInfra инвестиционным рынком отражает то, что значимость базовой инфраструктуры ИИ постепенно выходит за рамки самих моделей. Партнер 500 Global Tony Wang отметил, что в среде разработки, ориентированной на агентные системы, разработчикам нужен более гибкий, быстрый и надежный специализированный платформенный слой. После завершения этого раунда общий объем финансирования DeepInfra достигнет 133 млн долларов США; средства будут направлены на расширение глобальных вычислительных мощностей, углубление наборов инструментов для разработчиков, а также на поддержку моделей автономных агентных систем следующего поколения. По мере того, как каждую неделю объем обрабатываемых токенов приближается к 5 трлн токенов, DeepInfra ставит цель создать высокоэффективную «фабрику токенов», обеспечивая компаниям устойчивую основу вычислительных мощностей для этапа масштабирования AI-применений.

Эта статья «Долгосрочный открытый AI-партнер NVIDIA Deepinfra привлек 1,07 млрд долларов для раунда B и создает “фабрику токенов”» впервые появилась на «Chain News ABMedia».

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев