Le 29 avril, le chercheur de l’équipe multimodale de DeepSeek, Xiaokang Chen, a publié sur X : « Maintenant, nous te voyons », accompagné de deux images du mascotte baleine de DeepSeek — l’une avec les yeux fermés, l’autre avec les yeux ouverts. La publication semble faire allusion à un futur modèle de vision, en lien avec le rôle de Chen en tant que chercheur au sein de l’équipe multimodale de DeepSeek. DeepSeek a sorti V4, un modèle uniquement textuel, le 24 avril. La société n’a fait aucune annonce officielle concernant un nouveau modèle multimodal.
Related News
Sam Altman publie des captures d’écran du double mode de Codex, séparant officiellement les fonctions bureau et programmation
NVIDIA annonce Nemotron 3 Nano Omni open source multi-modal
Après l’arrivée de ChatGPT, la soumission d’articles augmente de 42% dans les revues de management : l’IA pousse la recherche vers le « plus » plutôt que vers le « mieux »