Mensagem do Gate News, 17 de abril — O Google revelou o Gemini 3.1 Flash TTS, um modelo avançado de texto para fala com recursos de expressão emocional e controle aprimorados, em 15 de abril. O novo modelo será disponibilizado gradualmente por meio de APIs para desenvolvedores, Vertex AI corporativo e ferramentas de colaboração.
As principais capacidades do modelo incluem tags de áudio baseadas em linguagem natural para ajustar a velocidade, a entonação e a emoção, além de um “Director Mode” para especificar cenas e papéis de personagens e gerar saídas de voz mais nuances. Um recurso de múltiplos locutores permite gerar diálogos simultâneos, possibilitando fluxos de conversa mais naturais, adequados para podcasts, conteúdos de áudio e assistentes de IA. O modelo suporta mais de 70 idiomas e dialetos, refletindo sotaques e expressões regionais para experiências de voz localizadas globalmente.
O Google destacou desempenho e eficiência de custos, alcançando altas pontuações em benchmarks de avaliação humana cega, enquanto reduzia custos computacionais com sua arquitetura Flash — projetada para adoção empresarial em larga escala. O áudio gerado inclui marca d’água SynthID para identificar conteúdo gerado por IA e combater a desinformação.
A iniciativa reflete a intensificação da concorrência em interfaces de voz. A OpenAI está combinando recursos de voz em tempo real com IA conversacional para interações semelhantes às humanas, enquanto a Meta está expandindo investimentos em personagens de IA com experiências sociais baseadas em voz. Observadores da indústria apontam que, embora atuação em alto nível e trabalhos criativos possam continuar sendo impulsionados por humanos por enquanto, mercados de produção repetitiva e em larga escala podem ver uma adoção gradual de IA em dublagem, publicidade e setores de audiobooks.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
O meme de “monitorar a situação” (MTS) do Vale do Silício vira uma máquina de notícias 24/7 entregue pela a16z
A16z está apoiando "Monitoring the Situation," um livestream do X 24/7 nascido da cultura de memes da Polymarket, enquanto VCs de tecnologia constroem seu próprio complexo de indústria de notícias.
Resumo
Andreessen Horowitz ajudou a lançar "Monitoring the Situation" (MTS), um programa de livestream 24/7 no X, apostando em mar de predição cripto
Cryptonews3h atrás
Google lança o Deep Research Max: suporta MCP e pode acessar dados privados de empresas
De acordo com o anúncio oficial do blog do Google DeepMind, o Google lançou, em 21 de abril de 2026, os novos agentes de pesquisa autônoma de próxima geração Deep Research e Deep Research Max, construídos sobre o Gemini 3.1 Pro, após a versão preview disponibilizada em dezembro de 2025 via Interactions API. As duas opções de agentes agora estão abertas ao público em formato public preview dentro dos planos pagos da Gemini API, e usuários de startups e empresas do Google Cloud irão se conectar em breve.
As duas variantes têm posicionamentos diferentes: interativo vs profundo em modo assíncrono
O Google categorizou os dois agentes por cenário de uso: Deep Research
ChainNewsAbmedia5h atrás
Usuários Ativos Mensais do OpenAI Codex atingem 4 milhões em menos de duas semanas
O OpenAI Codex atingiu 4 milhões de MAUs, anunciado por Sottiaux e Altman; o salto veio em menos de duas semanas a partir de 3 milhões, e os limites de taxa foram redefinidos em todas as categorias para comemorar.
O OpenAI Codex chegou a 4 milhões de usuários ativos mensais em menos de duas semanas desde alcançar 3 milhões, de acordo com declarações de executivos da OpenAI. Para marcar a conquista, os limites de taxa em todas as categorias foram redefinidos.
GateNews7h atrás
Duas startups de IA sul-africanas selecionadas para o Google for Startups Accelerator Africa, turma 10
Duas startups sul-africanas, Loop e Vambo AI, entram no 10º ciclo do Google Accelerator Africa da Google com base em 2.600 inscrições; o Loop aprimora mobilidade/pagamentos, enquanto o Vambo AI habilita IA multilíngue; o programa acontece de abr a jun de 2026 com mentores e workshops de IA.
Resumo: Duas startups sul-africanas, Loop e Vambo AI, foram selecionadas para o 10º ciclo do programa Google for Startups Accelerator Africa, escolhido entre cerca de 2.600 inscrições e um dos 15 participantes africanos. O Loop digitaliza mobilidade e pagamentos, enquanto a Vambo AI fornece infraestrutura de IA multilíngue para tradução, fala e IA generativa em idiomas africanos. O programa de 2026 acontece de 13 de abril a 19 de junho e oferece mentoria e workshops práticos focados em IA/ML. Desde 2018, o acelerador apoiou 106 startups de 17 países africanos, ajudando-as a levantar mais de $263 milhões e a criar mais de 2.800 empregos.
GateNews8h atrás
Lista Forbes AI 50 destaca 20 novas empresas; OpenAI e Anthropic capturam 80% do financiamento total
Mensagem do Gate News, 21 de abril — a Forbes lançou sua lista de 2026 da 8ª edição do AI 50, com 20 empresas recém-incluídas. A OpenAI e a Anthropic continuam a liderar o ranking, atraindo investimentos substanciais de importantes capitalistas de risco do Vale do Silício e de grandes empresas de tecnologia. O financiamento combinado de todas as empresas da lista atingiu $305,6 bilhões, com a OpenAI e a Anthropic respondendo por $242,6 bilhões — aproximadamente 80% do total.
GateNews8h atrás
Zi variável Revela o Modelo de IA Incorporada WALL-B; Robôs para Entrar em Lares Reais em 35 Dias
Mensagem do Gate News, 21 de abril — Zibianliang (自变量), uma empresa chinesa de robótica, realizou uma coletiva de imprensa em 21 de abril para revelar seu próximo modelo base de IA incorporada de nova geração, WALL-B. A empresa anunciou que robôs alimentados por WALL-B entrarão em lares reais em 35 dias.
De acordo com o fundador da Zibianliang co
GateNews9h atrás