29 апреля исследователь мультимодальной команды DeepSeek Сяокан Чэнь опубликовал в X: «Теперь, мы видим вас», сопроводив пост двумя изображениями талисмана DeepSeek — кита: на одном изображении глаза закрыты, а на другом — открыты. Похоже, пост намекает на готовящуюся модель зрения, что согласуется с ролью Чэня как исследователя в мультимодальной команде DeepSeek. 24 апреля DeepSeek выпустила V4 — модель, работающую только с текстом. Компания не делала официального заявления о новой мультимодальной модели.
Related News
Сэм Альтман опубликовал скриншоты Codex в двух режимах: офисные и программистские функции официально разделены
NVIDIA анонсировала Nemotron 3 Nano Omni с открытым исходным кодом мультимодальную модель
После появления ChatGPT число публикаций в журналах по менеджменту за учебный семестр выросло на 42%: ИИ продвигает науку скорее в сторону «большего количества», а не «качества»