Google Lança Chips de TPU de Oitava Geração com Melhor Relação Preço-Desempenho, Separa Treinamento e Inferência

Mensagem do Gate News, 22 de abril — A Google Cloud anunciou o lançamento de chips (Tensor Processing Unit) (Unidade de Processamento de Tensor) personalizados de sua oitava geração, baseados em TPU, em 22 de abril. A nova linha inclui a TPU 8t, projetada especificamente para tarefas de treinamento de IA, e a TPU 8i, otimizada para cargas de trabalho de inferência de IA. Ambos os chips estarão disponíveis mais tarde este ano. A Google também divulgou novas ferramentas para construir agentes de IA e anunciou um fundo de $750 um milhão para impulsionar a adoção de IA por empresas.

A TPU 8t oferece 2,8 vezes o desempenho do TPU Ironwood da geração anterior da Google, pelo mesmo preço. A TPU 8i melhora o desempenho em 80% em relação à predecessora e incorpora uma arquitetura de memória estática de acesso aleatório (SRAM) para entregar “alto throughput em larga escala e baixa latência, possibilitando que milhões de agentes sejam executados simultaneamente”, de acordo com o CEO Sundar Pichai. Em comparação com a Ironwood, tanto a TPU 8t quanto a TPU 8i atingem mais do que o dobro da eficiência desempenho-por-watt, com a TPU 8t melhorando em 124% e a TPU 8i em 117%. A Google otimizou a eficiência energética em toda a pilha de tecnologia e integrou sistemas de gerenciamento de energia dinâmicos que ajustam o consumo com base na demanda em tempo real.

Os modelos de primeira parte da Google agora processam mais de 160 bilhões de tokens por minuto por meio de chamadas diretas à API do cliente, acima dos 100 bilhões no trimestre passado. A IA agora gera 75% de todo o novo código na Google, em comparação com 50% no outono do ano passado. O Gemini Enterprise, oferta corporativa da Google, cresceu 40% de um trimestre para o outro em usuários ativos mensais pagantes. A empresa espera investir um pouco mais da metade do orçamento de computação de machine learning em serviços de nuvem até 2026 para melhor atender clientes e parceiros de nuvem. A Google também está expandindo sua colaboração com a Broadcom para desenvolver e fornecer chips de TPU personalizados para gerações futuras, enquanto grandes empresas de tecnologia buscam alternativas a GPUs caras e com oferta limitada da NVIDIA e da AMD.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

OpenAI lança modelo de Filtro de Privacidade open-source para detecção e remoção de PII

Resumo: O Filtro de Privacidade da OpenAI é um modelo de código aberto, executável localmente, que detecta e remove dados pessoais (PII) no texto. Ele oferece suporte a contextos grandes, identifica muitas categorias de PII e é destinado a fluxos de trabalho que preservam a privacidade, como preparação de dados, indexação, registro (logging) e moderação. O Filtro de Privacidade da OpenAI é um modelo de código aberto executado localmente (128k-token context) que detecta e remove PII no texto, cobrindo dados de contato, financeiros e de credenciais para fluxos de trabalho de privacidade.

GateNews22m atrás

A OpenAI Planeja Implantar 30GW de Capacidade de Computação até 2030

A OpenAI mira 30GW de capacidade de computação até 2030 para atender à crescente demanda por IA, com 8GW já concluídos de uma meta de 10GW para 2025. A expansão sinaliza uma estratégia para ampliar a infraestrutura para o desenvolvimento e a implantação de IA de próxima geração. A OpenAI pretende atingir 30GW de capacidade de computação até 2030 para acomodar a crescente demanda por IA, tendo já concluído 8GW de uma meta de 10GW para 2025. A medida reflete uma expansão estratégica da infraestrutura para apoiar o desenvolvimento e a implantação de IA de próxima geração.

GateNews23m atrás

Agente de Descoberta de Vulnerabilidades por IA da 360 Encontra Quase 1.000 Exploits de Zero-Day, Competindo com a Mythos

O agente orientado por IA da 360 Digital Security afirma ter encontrado cerca de 1.000 novas vulnerabilidades, incluindo no Office e no OpenClaw; a IA agora é central para a descoberta e a preparação de cadeias de exploração, rivalizando com a Mythos. Resumo: Um relatório citado pela Bloomberg observa que o Agente de Descoberta de Vulnerabilidades orientado por IA do 360 Digital Security Group identificou quase 1.000 vulnerabilidades previamente desconhecidas nos últimos meses, incluindo no Microsoft Office e no framework OpenClaw. A empresa afirma que a IA se tornou a base central da descoberta de vulnerabilidades e anunciou uma ferramenta de IA para acelerar a construção de cadeias de exploração. Benincasa descreve a 360 como uma concorrente da Mythos, da Anthropic, com base na análise de Natto Thoughts das comunicações da empresa em idioma chinês.

GateNews28m atrás

Yifan Zhang Divulga as Especificações Técnicas Completas do DeepSeek V4: 1,6T Parâmetros, 384 Especialistas com 6 Ativações

Mensagem do Gate News, 22 de abril — o estudante de PhD da Princeton, Yifan Zhang, divulgou no X as especificações técnicas completas do DeepSeek V4, após um prévio em 19 de abril. O V4 tem 1,6 trilhão de parâmetros no total e uma variante leve, o V4-Lite, com 285 bilhões de parâmetros. O modelo emprega o mecanismo de atenção DSA2

GateNews1h atrás

CEO da Anthropic vai ao encontro da Casa Branca para iniciar conversas amistosas: se reúne com o Chefe de Gabinete e com Bessent para discutir o Mythos

O The Wall Street Journal afirma que o CEO da Anthropic, Amodei, teve um encontro privado na Casa Branca em 17/04, com foco nas fronteiras de segurança nacional e implantação responsável do Mythos; a Casa Branca disse que a reunião foi construtiva, e o mercado vê isso como um descongelamento das relações. A principal divergência é que as forças armadas querem que o Claude seja usado para quaisquer fins legais, enquanto a Anthropic insiste que tem discricionariedade em sua própria política de uso aceitável. Ambas as partes disseram que continuarão o diálogo, para discutir novamente antes do lançamento do Mythos em maio.

ChainNewsAbmedia2h atrás

Google Ironwood TPU: 10x de desempenho + quatro parceiros contra a Nvidia

De acordo com uma reportagem aprofundada da Bloomberg e um anúncio oficial do Google, em 22 de abril o Google expandiu oficialmente sua linha de chips de IA próprios: o Ironwood dedicado a inferência (TPU de 7ª geração) foi disponibilizado integralmente no Google Cloud, e simultaneamente foi iniciada uma colaboração de próxima geração com quatro parceiros — Broadcom, MediaTek, Marvell e Intel — com o objetivo de, por meio de uma cadeia de suprimento de chips sob medida, desafiar de forma positiva a posição dominante da Nvidia no mercado de capacidade de IA. Ironwood: TPU de 7ª geração, primeira voltada a inferência O Ironwood é o produto de 7ª geração da série de TPU do Google e o primeiro chip dedicado a inferência sob a estratégia de “separação entre treinamento e inferência”. As especificações reveladas pelo Google: o desempenho de pico por chip é T

ChainNewsAbmedia2h atrás
Comentário
0/400
Sem comentários