Google 推出第八代 TPU 芯片:性能价格比提升,并将训练与推理分离

Gate News 消息,4 月 22 日——Google Cloud 宣布,于 4 月 22 日发布其第八代自研定制 TPU (Tensor Processing Unit) 芯片。新的产品线包括 TPU 8t,专为 AI 训练任务而设计,以及 TPU 8i,针对 AI 推理工作负载进行了优化。两款芯片都将于今年晚些时候上市。Google 还发布了用于构建 AI 代理的新工具,并宣布设立一项 $750 百万美元基金,以推动企业采用 AI。

TPU 8t 在相同价格水平下,性能比 Google 上一代 Ironwood TPU 提升 2.8 倍。TPU 8i 相较其前代产品性能提升 80%,并采用静态随机存取内存 (SRAM) 架构,以实现“具有成本效益的大规模吞吐与低延迟,使数百万个代理能够同时运行”,CEO Sundar Pichai 表示。与 Ironwood 相比,TPU 8t 和 TPU 8i 的每瓦性能效率均实现了超过两倍的提升,其中 TPU 8t 提升 124%,TPU 8i 提升 117%。Google 在整个技术栈中优化了能效,并集成了动态功率管理系统,可根据实时需求调整能耗。

Google 自研模型目前通过直接面向客户的 API 调用,每分钟处理超过 1600 亿个 token,较上季度的 1000 亿有所增长。在 Google 上,AI 现在生成了所有新增代码的 75%,而去年秋季为 50%。Google 的企业产品 Gemini Enterprise 在付费月活用户方面实现了环比增长 40%。公司预计到 2026 年,将其机器学习计算预算中略多于一半投向云服务,以更好地服务云端客户与合作伙伴。Google 也在扩大与博通(Broadcom)的合作,以为未来世代开发并供应定制 TPU 芯片,因为大型科技公司正寻求对来自 NVIDIA 和 AMD 的昂贵且供给受限 GPU 的替代方案。

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

OpenAI выпустила модель с открытым исходным кодом для обнаружения и редактирования ПДн

Аннотация: Фильтр конфиденциальности OpenAI — это модель с открытым исходным кодом, выполняемая локально, которая обнаруживает и редактирует ПДн (персональные данные) в тексте. Она поддерживает большие контексты, выявляет множество категорий ПДн и предназначена для рабочих процессов с сохранением конфиденциальности, таких как подготовка данных, индексация, логирование и модерация. Фильтр конфиденциальности OpenAI — это локально запускаемая модель с открытым исходным кодом (128k-token context), которая обнаруживает и редактирует ПДн (персональные данные) в тексте, охватывая контактные, финансовые и учетные данные для рабочих процессов по защите конфиденциальности.

GateNews22м назад

OpenAI планирует развернуть 30 ГВт вычислительных мощностей к 2030 году

OpenAI планирует обеспечить 30 ГВт вычислительных мощностей к 2030 году, чтобы удовлетворить растущий спрос на ИИ, при этом уже завершено 8 ГВт из целевых 10 ГВт на 2025 год. Расширение сигнализирует о стратегии наращивания инфраструктуры для разработки и развертывания ИИ следующего поколения. OpenAI намерена достичь 30 ГВт вычислительных мощностей к 2030 году, чтобы удовлетворить растущий спрос на ИИ, уже завершив 8 ГВт из целевого показателя 10 ГВт на 2025 год. Действие отражает стратегическое расширение инфраструктуры для поддержки разработки и развертывания ИИ следующего поколения.

GateNews22м назад

Агент 360 для обнаружения уязвимостей на базе ИИ находит почти 1 000 нулевых дней с эксплойтом, конкурируя с Mythos

Агент на базе ИИ от 360 Digital Security утверждает, что нашёл около 1 000 новых уязвимостей, включая в Office и OpenClaw; сейчас ИИ является ключевым для обнаружения и подготовки цепочек эксплуатации, соперничая с Mythos. Абстракт: В отчёте, на который ссылается Bloomberg, говорится, что Vulnerability Discovery Agent компании 360 Digital Security на базе ИИ выявил почти 1 000 ранее неизвестных уязвимостей за последние месяцы, включая уязвимости в Microsoft Office и в фреймворке OpenClaw. Компания заявляет, что ИИ стал основным движком для обнаружения уязвимостей, и объявила об инструменте на базе ИИ, который ускорит построение цепочек эксплуатации. Бенинкаса описывает 360 как конкурента Mythos от Anthropic на основе обзора китайскоязычных анонсов компании, сделанного Natto Thoughts.

GateNews28м назад

Ифань Чжан раскрывает полные технические спецификации DeepSeek V4: 1,6T параметров, 384 эксперта с 6 активациями

Сообщение Gate News, 22 апреля — студент Принстонского PhD Ифань Чжан раскрыл полные технические спецификации DeepSeek V4 в X, после превью от 19 апреля. V4 имеет 1,6 трлн общих параметров и облегчённую версию V4-Lite с 285 млрд параметров. Модель использует механизм внимания DSA2

GateNews1ч назад

Глава Anthropic едет в Белый дом на встречу для ледокольного старта: обсуждение с руководителем аппарата, Бессентом Mythos

The Wall Street Journal reports that on 4/17, Anthropic CEO Amodei met privately with the White House, focusing on Mythos’s national security boundary and responsible deployment; the White House said the meeting was constructive, and the market views it as a thaw in relations. The core disagreement is that the military wants Claude for all lawful purposes, while Anthropic insists on its own policy discretion for acceptable use. Both sides said they will continue the dialogue and discuss again before Mythos goes live in May.

ChainNewsAbmedia2ч назад

Google Ironwood TPU: 10-кратная производительность + четыре партнёра против Nvidia

Согласно углубленному репортажу Bloomberg и официальному объявлению Google, 22 апреля Google официально расширила линейку собственных ИИ-чипов: чип для вывода Ironwood (7-е поколение TPU) теперь полностью доступен в Google Cloud, а также одновременно запущено сотрудничество по разработке следующего поколения с партнерами Broadcom, MediaTek, Marvell и Intel. Цель — за счет ориентированной на заказ цепочки поставок чипов бросить прямой вызов доминирующему положению Nvidia на рынке ИИ-вычислительных мощностей. Ironwood: 7-е поколение TPU, впервые созданный специально для вывода Ironwood — продукт Google TPU серии седьмого поколения и первая специализированная микросхема для вывода в рамках стратегии «разделения обучения и вывода». Обнародованные Google спецификации: пиковая производительность на одном чипе составляет T

ChainNewsAbmedia2ч назад
комментарий
0/400
Нет комментариев