Команда Beating из Шэньчжэньского колледжа Хэтао, Шэньчжэньского отделения Харбинского технологического института, Шэньчжэньского исследовательского института больших данных, Huawei и Deepcity AI объявила об успешном завершении полного постобучения с полными параметрами для DeepSeek-V4-Pro — модели с 1,6 триллиона параметров — на отечественной инфраструктуре для ИИ. Это первый случай, когда сторонняя организация завершила полное постобучение с полными параметрами для модели такого масштаба на китайском оборудовании.
Команда использовала кластер из более чем 1 000 чипов Huawei Ascend 910C, чтобы преодолеть узкие места в коммуникациях за счет оптимизированной распределенной балансировки нагрузки. В ходе процесса постобучения на 1 500 шагах система работала без остановок, достигнув уровня загрузки FLOPs модели (MFU) свыше 30% и повысив эффективность ключевых операторов на 14%, при этом были выполнены стандарты производительности индустриального класса.