Xiaohu démontre un flux de travail intermodèles : génération d’images avec GPT + contenu interactif 3D converti depuis Gemini 3.1 Pro

ChainNewsAbmedia

L’observateur d’IA chinois xiaohu a partagé le 10 mai un exemple de workflow combinant GPT et Gemini 3.1 Pro : d’abord utiliser GPT pour générer des images, puis utiliser Gemini 3.1 Pro pour transformer ces images en contenus 3D interactifs, pouvant faire de n’importe quel sujet de connaissances des applications scientifiques rotatives et actionnables. Les exemples présentés dans le tweet de xiaohu incluent des démonstrations de planètes en 3D, des modèles scientifiques interactifs, etc. Il s’agit d’une pratique concrète du « workflow inter-modèles » (multi-model workflow).

Structure du workflow : GPT pour générer des images → Gemini 3.1 Pro pour les rendre en 3D

Conception en deux étapes du workflow :

Étape 1 : utiliser GPT (GPT-image-1 ou la génération d’images intégrée à ChatGPT) pour produire une image de sujet et fournir la base visuelle

Étape 2 : entrer l’image dans Gemini 3.1 Pro, puis Gemini convertit une image 2D en contenu interactif 3D

Format de sortie : des objets 3D rotatifs, zoomables et interactifs dans un navigateur

Cas d’usage : éducation scientifique, démonstration de produits, contenus de connaissances interactifs

Le « workflow inter-modèles » est l’une des tendances clés de la couche d’applications IA en 2026 : un modèle unique n’est plus un outil universel, et les développeurs enchaînent les meilleures capacités de différents modèles pour créer des applications impossibles à réaliser avec un seul modèle.

Démonstrations concrètes : planètes en 3D, contenus scientifiques interactifs, site web de distributeur automatique de robots

Plusieurs exemples publiés simultanément par xiaohu :

Démonstration de planètes en 3D : un système solaire rotatif ou un modèle de planète unique

Contenu scientifique interactif : transformer des connaissances abstraites en visualisations 3D, adaptées à l’éducation

Site web futuriste de distributeur de robots : utiliser la génération d’images avec GPT, puis ajouter la plateforme Tripo 3D pour créer une page web de démonstration

Caractéristique commune de ces exemples : « génération visuelle + conversion interactive » — GPT est responsable de la création visuelle, tandis que Gemini ou d’autres outils 3D se chargent de transformer des images statiques en formes interactives actionnables. Pris séparément, chaque segment ne serait pas nouveau, mais une fois chaînés, l’expérience finale est supérieure à celle de n’importe quel outil unique.

Signification : le workflow inter-modèles devient progressivement un mode de développement dominant

Retombées concrètes pour les développeurs :

Choisir les bons outils est plus important que choisir le modèle le plus puissant — GPT pour la vision, Gemini pour la compréhension multimodale, Claude pour le long context, chacun a ses points forts

Le coût d’intégration des API de modèles baisse, ce qui rend l’enchaînement de plusieurs modèles faisable au niveau de l’implémentation

Les nouvelles applications seront très probablement des « pipelines inter-modèles », plutôt qu’une simple extension du « meilleur modèle unique »

La valeur de ce projet ne réside pas dans une percée technique, mais dans un modèle de conception de workflow

Événements précis à suivre ensuite : si les capacités de génération 3D de Gemini 3.1 Pro seront annoncées officiellement par Google comme fonctionnalité produit lors d’événements ultérieurs, si les workflows inter-modèles obtiendront une prise en charge de modèles par défaut dans des cadres comme LangChain/LlamaIndex, et des exemples concrets d’adoption dans des cas d’usage de commercialisation (comme l’éducation, le e-commerce, le marketing).

Cet article où xiaohu démontre un workflow inter-modèles : génération d’images avec GPT + conversion en contenu interactif 3D avec Gemini 3.1 Pro a été publié en premier sur ABMedia, chaîne d’actualités.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Blockify réécrit le RAG d’entreprise : remplacer le chunking par IdeaBlock, comprimer 40 fois, réduire les tokens de 3 fois

企業 IA資料優化新工具 Blockify 5 月 9 日由 akshay\pachaar 整理推廣,宣稱在 RAG(Retrieval-Augmented Generation)流程中可压縮 40 倍企業資料庫、查詢 token 用量減 3 倍、向量搜尋準確率提升 2,3 倍。Blockify 官方 GitHub 說明:產品由 Iternal Technologies 推出,用「IdeaBlock」結構化知識單元取代傳統 chunking,並透過去重合併讓知識庫保持精簡、連貫、可治理。 核心概念:用 IdeaBlock 取代傳統 chunking Blockify 的技術設計: 傳統做法:把長文件切成固定大小的 chunk、嵌入向量、檢索時取 top-k Blockify 做法:把原始內容轉換為 IdeaBlock—XML 結構化知識單元 每個 IdeaBlock 內含:自帶問題、可信答案、tag、實體、關鍵字 相似 IdeaBlock 自動去重合併、知識庫不會隨內容增長膨脹 傳統 chunking 的問題是同一資訊可能在多個 chunk 中重複出現,造成檢索冗餘與 token 浪費

ChainNewsAbmediaIl y a 4h

Alibaba va intégrer Qwen AI avec Taobao, lançant un service d’achats par IA avec 4 milliards de produits

D’après des sources citées par Jinshi, Alibaba prévoit d’intégrer sa plateforme d’IA Qwen au service e-commerce Taobao afin de permettre des achats via une intelligence artificielle conversationnelle plutôt que par des recherches par mots-clés. Cette intégration permettra aux consommateurs de parcourir, comparer et acheter des articles en dialoguant avec un assistant IA dans l’application Qwen, avec accès au catalogue de plus de 4 milliards de produits de Taobao et Tmall. Le service proposera de

GateNewsIl y a 11h

DMG Blockchain crée une filiale DMG Infrastructure pour ses opérations d’IA et de calcul haute performance (HPC)

D'après BlockBeats, le 9 mai, la société d'exploitation minière Bitcoin DMG Blockchain a créé sa filiale DMG Infrastructure pour gérer ses activités d'intelligence artificielle et d'informatique haute performance (HPC). L'entreprise prévoit de faire évoluer ses centres de données vers des services d'IA et de HPC. DMG Blockchain a produit 21 BTC en avril, contre 23 BTC en mars.

GateNews05-09 04:25

Spotify lance aujourd’hui la fonctionnalité de podcasts personnels générés par IA, permettant de les enregistrer dans la bibliothèque

Selon MacRumors, Spotify a lancé une nouvelle fonctionnalité aujourd’hui (8 mai) permettant aux utilisateurs de générer et d’enregistrer des podcasts personnels alimentés par l’IA directement dans leur bibliothèque Spotify. Les utilisateurs peuvent installer et se connecter à la fonctionnalité « Save to Spotify CLI » sur ordinateur, puis utiliser des agents de codage IA d’OpenAI, Anthropic et d’autres t

GateNews05-08 14:46

Benzinga lance un moteur de traduction coréen et un ensemble de données financières d'IA de 400 millions de mots

Benzinga a récemment lancé un moteur de traduction en coréen ainsi qu’un vaste ensemble de données financières coréennes conçu pour l’entraînement de l’IA, selon l’entreprise. Le système traduit en temps réel l’actualité des marchés américains en coréen tout en préservant la terminologie financière, les références aux tickers et le contexte du marché. Le

GateNews05-08 11:32

FLock.io participe à une table ronde d'Oxford pour faire avancer le MoU sur une IA souveraine du Sarawak

Selon Foresight News, FLock.io a participé à une discussion en table ronde à l’Université d’Oxford afin de faire avancer un protocole d’accord tripartite sur le développement souverain de l’IA au Sarawak. La discussion a porté sur la souveraineté des données, la collaboration en matière d’IA, la gouvernance de la sécurité des données et le matériel

GateNews05-08 11:01
Commentaire
0/400
Aucun commentaire