Xiaohu demonstra um fluxo de trabalho entre modelos: criação de imagens com GPT + conteúdo 3D interativo convertido a partir do Gemini 3.1 Pro

O observador de IA chinês xiaohu partilhou a 10 de maio um exemplo de um fluxo de trabalho que combina GPT e Gemini 3.1 Pro: primeiro, usar GPT para gerar imagens e, depois, usar Gemini 3.1 Pro para transformar as imagens em conteúdo 3D interativo, que pode transformar qualquer tema de conhecimento em aplicações científicas rotativas e operacionais. Os exemplos mostrados no tweet de xiaohu incluem demonstrações de planetas 3D e modelos científicos interativos, entre outros — uma prática concreta de um “fluxo de trabalho multi-modelo” (multi-model workflow).

Estrutura do fluxo de trabalho: GPT a gerar imagens → Gemini 3.1 Pro a torná-las em 3D

A estrutura de todo o fluxo de trabalho é composta por duas fases:

Fase um: usar GPT (GPT-image-1 ou a geração de imagens integrada no ChatGPT) para produzir imagens base do tema e fornecer suporte visual

Fase dois: inserir a imagem no Gemini 3.1 Pro, para o Gemini transformar a imagem 2D em conteúdo 3D interativo

Formato de saída: objectos 3D rotativos, ampliáveis e interactivos dentro do navegador

Cenários de aplicação: educação científica, demonstração de produtos, conteúdos de interacção com conhecimento

“Fluxo de trabalho multi-modelo” é uma das principais tendências na camada de aplicações de IA de 2026 — já não é o caso de um único modelo ser uma solução para tudo. Os programadores ligam as partes mais fortes de diferentes modelos e criam aplicações que um único modelo não conseguiria fazer.

Demonstração concreta: planetas 3D, conteúdos científicos interactivos, sites de venda de robôs

Vários exemplos publicados em simultâneo por xiaohu:

Demonstração de planetas 3D: um sistema solar rotativo ou um modelo de planeta único

Conteúdo científico interactivo: transformar conhecimentos abstractos em visualizações 3D, adequado para fins educativos

Site futuro de máquinas de venda por robôs: usar imagens geradas pelo GPT e adicionar a plataforma Tripo 3D para criar páginas web de carácter demonstrativo

As características comuns destes exemplos são “geração visual + transformação interactiva”: o GPT é responsável pela criatividade e visualização, enquanto o Gemini ou outras ferramentas 3D são responsáveis por transformar imagens estáticas em formas interactivas e operacionais. Isoladamente, cada passo não é novidade, mas, em conjunto, a experiência final é superior à de qualquer ferramenta única.

Significado: fluxos de trabalho multi-modelo estão a tornar-se numa abordagem de desenvolvimento dominante

Implicações concretas para os programadores:

Escolher as ferramentas certas é mais importante do que escolher o modelo mais forte — o GPT é forte em visual, o Gemini em compreensão multimodal, o Claude em contextos longos; cada um tem os seus pontos fortes

Os custos de integração das APIs dos modelos baixam, e ligar vários modelos ao nível da implementação torna-se viável

Aplicações novas são provavelmente “pipelines multi-modelo”, e não uma extensão do “melhor modelo único”

O valor desta proposta não está numa ruptura tecnológica, mas num modelo de design de fluxo de trabalho

Eventos concretos a acompanhar no futuro: se a capacidade de geração 3D do Gemini 3.1 Pro for anunciada oficialmente pela Google como funcionalidade de produto em actividades subsequentes; se o fluxo de trabalho multi-modelo receber suporte de templates predefinidos em frameworks como LangChain/LlamaIndex; e exemplos concretos de adopção em casos de comercialização (como educação, comércio electrónico e marketing).

Este artigo em que xiaohu demonstra um fluxo de trabalho multi-modelo (GPT a gerar imagens + Gemini 3.1 Pro a transformar em conteúdo 3D interativo) apareceu pela primeira vez em 鏈新聞 ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Blockify reescreve o RAG para empresas: usa o IdeaBlock em vez de chunking, comprime 40 vezes e reduz o token em 3 vezes

A nova ferramenta de optimização de dados de IA para empresas, Blockify, foi organizada e promovida em 9 de Maio por akshay\pachaar, que afirma que, no processo de RAG (Retrieval-Augmented Generation), consegue comprimir as bases de dados das empresas 40 vezes, reduzir em 3 vezes o consumo de tokens nas consultas e aumentar em 2,3 vezes a precisão da pesquisa vectorial. Na explicação oficial do GitHub da Blockify: o produto é apresentado pela Iternal Technologies; usa unidades de conhecimento es

ChainNewsAbmedia6h atrás

A Alibaba vai integrar a IA Qwen no Taobao, lançando um serviço de compras com IA com 4 mil milhões de produtos

De acordo com fontes citadas por Jinshi, a Alibaba prepara-se para integrar a sua plataforma de IA Qwen com o serviço de comércio eletrónico Taobao para permitir compras através de inteligência artificial conversacional, em vez de pesquisas por palavras-chave. A integração vai permitir que os consumidores naveguem, comparem e comprem artigos através do diálogo com um assistente de IA na app Qwen, com acesso ao catálogo do Taobao e da Tmall, com mais de 4 mil milhões de produtos. O serviço vai di

GateNews12h atrás

DMG Blockchain cria subsidiária DMG Infrastructure para operações de IA e HPC

De acordo com a BlockBeats, a 9 de maio, a empresa de mineração de Bitcoin DMG Blockchain criou a subsidiária DMG Infrastructure para operar o negócio de inteligência artificial e computação de alto desempenho (HPC). A empresa planeia fazer a transição dos seus centros de dados para serviços de IA e HPC. A DMG Blockchain produziu 21 BTC em abril, abaixo dos 23 BTC em março.

GateNews05-09 04:25

A Spotify lança hoje um recurso de podcasts pessoais gerados por IA, permitindo guardar na biblioteca

De acordo com a MacRumors, a Spotify lançou hoje (8 de maio) uma nova funcionalidade que permite aos utilizadores gerar e guardar podcasts pessoais com IA diretamente na sua biblioteca da Spotify. Os utilizadores podem instalar e iniciar sessão no “Save to Spotify CLI” no desktop e, em seguida, usar agentes de programação com IA da OpenAI, da Anthropic e de outros para t

GateNews05-08 14:46

A Benzinga Lança um Motor de Tradução em Coreano e um Conjunto de Dados Financeiros de IA com 400 Mil Palavras

A Benzinga lançou recentemente um motor de tradução em coreano e um grande conjunto de dados financeiros em coreano, concebidos para treino de IA, de acordo com a empresa. O sistema traduz notícias do mercado dos EUA para coreano em tempo real, preservando a terminologia financeira, as referências aos tickers e o contexto do mercado. O

GateNews05-08 11:32

A FLock.io participa no encontro do Oxford Roundtable para impulsionar o MoU de IA soberana de Sarawak

De acordo com a Foresight News, a FLock.io participou numa discussão em formato de mesa-redonda da Universidade de Oxford para impulsionar um memorando de entendimento tripartido sobre o desenvolvimento soberano de IA em Sarawak. A discussão centrou-se na soberania dos dados, na colaboração em IA, na governação da segurança dos dados e no hardware

GateNews05-08 11:01
Comentar
0/400
Nenhum comentário