Сообщение Gate News, 24 апреля — В Соединенных Штатах разгорелись споры о технологических возможностях и соблюдении требований DeepSeek V4. Крис Макгвайр, старший научный сотрудник Совета по международным отношениям (CFR) и бывший сотрудник Совета по национальной безопасности при Белом доме и Министерства обороны, опубликовал аналитический материал, утверждающий, что V4 не изменила конкурентный ландшафт ИИ США и Китая. По словам Макгвайра, собственный отчет DeepSeek о V4 признает, что его рассуждающие возможности отстают от передовых моделей примерно на 3–6 месяцев, при этом в качестве бенчмарков используются GPT-5.2 и Gemini 3.0 Pro, выпущенные шестью месяцами ранее.

Макгвайр выразил обеспокоенность тем, что, хотя отчет о V4 раскрывает адаптацию на стадии инференса для графических процессоров NVIDIA и нейронных процессоров Huawei Ascend NPU, он публично не указывает модели GPU или затраты на обучение, использованные в ходе разработки. Он задался вопросом, означает ли это молчание использование экспорт-контролируемых чипов NVIDIA Blackwell, отметив, что ранее V3 заявляла об использовании 2 000 GPU H800 по цене 5,57 млн долларов. DeepSeek опроверг использование Blackwell, заявив, что модель была обучена на процессорах NVIDIA H800 и Huawei Ascend 910C.

CEO Replit Амджад Масад возразил анализу Макгвайра, заявив, что китайские ученые публично делятся подлинными прорывами в области ИИ, в то время как американские политики и лоббисты усиливают опасения о «китайской дистилляции». Масад подчеркнул архитектурные инновации, раскрытые в официальных заявлениях DeepSeek, включая сжатие внимания на уровне токенов (DeepSeek Sparse Attention) и существенные улучшения эффективности для вычислений при длинном контексте. Он отметил, что V4-Pro демонстрирует значительно более низкие требования к вычислениям инференса на токен и к KV cache при длине контекста 1M по сравнению с V3.2, подчеркнув, что эти архитектурные достижения не связаны с дистилляцией обучающих данных, и что все исследователи, включая американские лаборатории, могут извлечь пользу из открытых разработок.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

04-24 04:49

DeepSeek V4 получает идеальный результат на Putnam-2025, делит первое место с Axiom в формальном математическом рассуждении

04-24 04:29

V4-Pro демонстрирует 67% процент успешного прохождения кода во внутреннем тесте догфудинга, приближаясь к производительности Opus 4.5

04-24 03:21

Данные обучения DeepSeek V4 удвоены до 33T — возникла нестабильность, из-за которой релиз был отложен

04-24 03:04

DeepSeek выпускает серию открытых моделей V4 с 1,6T параметров и лицензией MIT

04-24 01:46

OpenAI представляет GPT-5.5, разработанную для задач агентов и сложных рабочих процессов

Детальный анализ