Xiaohu demonstra um fluxo de trabalho entre modelos: GPT gera imagens + Gemini 3.1 Pro transforma em conteúdo 3D interativo

ChainNewsAbmedia

O observador de IA chinês xiaohu compartilhou em 10 de maio um exemplo de fluxo de trabalho que combina GPT e Gemini 3.1 Pro: primeiro, usar GPT para gerar imagens e, depois, usar Gemini 3.1 Pro para transformar as imagens em conteúdo interativo 3D. Isso permite transformar qualquer tema de conhecimento em aplicações científicas rotacionáveis e acionáveis. O post do xiaohu no Twitter mostra exemplos como exibições de planetas em 3D, modelos científicos interativos etc., que são uma prática concreta de “fluxo de trabalho entre modelos” (multi-model workflow).

Estrutura do fluxo de trabalho: GPT cria imagens → Gemini 3.1 Pro as transforma em 3D

O design do fluxo de trabalho em duas etapas:

Etapa um: usar GPT (GPT-image-1 ou geração de imagens embutida no ChatGPT) para produzir imagens temáticas e fornecer base visual

Etapa dois: inserir a imagem no Gemini 3.1 Pro, que transforma imagens 2D em conteúdo interativo 3D

Formato de saída: objetos 3D que podem ser rotacionados, ampliados e interagidos dentro do navegador

Cenários de uso: educação científica, demonstração de produtos, conteúdos de conhecimento interativo

“Fluxo de trabalho entre modelos” é uma das principais tendências da camada de aplicações de IA em 2026 — um único modelo não é mais uma solução universal; desenvolvedores conectam partes mais fortes de modelos diferentes para criar aplicações que um único modelo não conseguiria fazer.

Demonstração específica: planetas em 3D, conteúdo científico interativo, site de vendas com robôs

Vários exemplos publicados pelo xiaohu em paralelo:

Exibição de planetas em 3D: sistema solar rotacionável ou modelo de um único planeta

Conteúdo científico interativo: transformar conhecimento abstrato em visualização 3D, adequado para fins educacionais

Site futuro de máquina de venda com robôs: usar GPT para gerar imagens e a plataforma Tripo 3D para criar uma página de demonstração

As características em comum desses exemplos é “geração visual + conversão interativa” — o GPT fica responsável pela visão criativa, enquanto o Gemini ou outras ferramentas 3D ficam responsáveis por transformar imagens estáticas em formatos interativos acionáveis. Tirado uma peça por vez, cada trecho isolado não é algo novo, mas ao conectar, a experiência final é melhor do que a de qualquer ferramenta única.

Significado: fluxo de trabalho entre modelos se torna gradualmente o modo de desenvolvimento principal

Implicações concretas para desenvolvedores:

Escolher a ferramenta certa é mais importante do que escolher o modelo mais forte — o GPT é forte em visual, o Gemini em compreensão multimodal, o Claude em long context, e cada um tem seu ponto forte

O custo de integração de APIs de modelos cai, e conectar vários modelos em nível de implementação fica viável

Aplicações novas provavelmente serão “pipelines entre modelos”, e não uma extensão de “um único modelo mais forte”

O valor deste caso não está em uma ruptura técnica, e sim em um modelo de design de fluxo de trabalho

Eventos específicos que podem ser acompanhados depois: se a capacidade de geração 3D do Gemini 3.1 Pro será anunciada oficialmente pela Google como função de produto em atividades posteriores; se o fluxo de trabalho entre modelos receberá suporte a templates padrão em frameworks como LangChain/LlamaIndex; e exemplos concretos de adoção em casos comerciais (como educação, e-commerce, marketing).

Este artigo, em que o xiaohu demonstra o fluxo de trabalho entre modelos: GPT gera imagens + Gemini 3.1 Pro transforma em conteúdo interativo 3D, surgiu pela primeira vez em 鏈新聞 ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Blockify reescreve empresas com RAG: usa IdeaBlock em vez de chunking, comprime 40 vezes, reduz tokens em 3 vezes

A nova ferramenta de otimização de dados para IA corporativa Blockify, em 9 de maio, foi organizada e divulgada por akshay\pachaar, que alega que, no processo de RAG (Retrieval-Augmented Generation), é possível comprimir os bancos de dados corporativos em 40 vezes, reduzir em 3 vezes o consumo de tokens na busca e aumentar a precisão da pesquisa vetorial em 2,3 vezes. A documentação oficial do GitHub da Blockify diz que o produto foi desenvolvido pela Iternal Technologies, usando unidades estrut

ChainNewsAbmedia2h atrás

Alibaba vai integrar a IA Qwen ao Taobao, lançando um serviço de compras com IA com 4 bilhões de produtos

Com base em fontes citadas por Jinshi, a Alibaba está prestes a integrar sua plataforma de IA Qwen ao serviço de e-commerce Taobao para permitir compras por meio de IA conversacional, em vez de buscas por palavras-chave. A integração permitirá que os consumidores naveguem, comparem e comprem itens por meio de diálogos com um assistente de IA no app Qwen, com acesso ao catálogo do Taobao e do Tmall, que tem mais de 4 bilhões de produtos. O serviço fornecerá recomendações de compras com base no hi

GateNews9h atrás

A DMG Blockchain cria uma subsidiária de infraestrutura da DMG para operações de IA e HPC

De acordo com a BlockBeats, em 9 de maio, a empresa de mineração de Bitcoin DMG Blockchain criou a subsidiária DMG Infrastructure para operar negócios de inteligência artificial e computação de alto desempenho (HPC). A empresa planeja fazer a transição de seus data centers para serviços de IA e HPC. A DMG Blockchain produziu 21 BTC em abril, abaixo dos 23 BTC em março.

GateNews05-09 04:25

O Spotify Lança Recurso de Podcasts Pessoais Gerados por IA Hoje, Permitindo Salvar na Biblioteca

De acordo com a MacRumors, o Spotify lançou hoje (8 de maio) um novo recurso que permite aos usuários gerar e salvar podcasts pessoais com tecnologia de IA diretamente na biblioteca do Spotify. Os usuários podem instalar e fazer login no "Save to Spotify CLI" no desktop e, em seguida, usar agentes de codificação de IA da OpenAI, Anthropic e outros t

GateNews05-08 14:46

Benzinga Lança Motor de Tradução em Coreano e um Conjunto de Dados Financeiros de IA com 400 milhões de palavras

A Benzinga lançou recentemente um mecanismo de tradução em coreano e um grande conjunto de dados financeiros em coreano, voltado para treinamento de IA, de acordo com a empresa. O sistema traduz notícias do mercado dos EUA para o coreano em tempo real, mantendo a terminologia financeira, as referências a tickers e o contexto do mercado. A

GateNews05-08 11:32

A FLock.io participa da Oxford Roundtable para avançar o MoU de IA soberana de Sarawak

De acordo com a Foresight News, a FLock.io participou de uma discussão em mesa-redonda na Universidade de Oxford para avançar um memorando de entendimento tripartite sobre o desenvolvimento soberano de IA em Sarawak. A discussão se concentrou em soberania de dados, colaboração em IA, governança de segurança de dados e hardware

GateNews05-08 11:01
Comentário
0/400
Sem comentários