Lab AI asal China, DeepSeek, sedang dalam pembicaraan untuk mengumpulkan pendanaan putaran pertamanya dengan valuasi yang dilaporkan mencapai 45 miliar dolar AS, menurut TechCrunch. Valuasi ini menandai kenaikan signifikan dari estimasi valuasi 20 miliar dolar AS hanya beberapa minggu sebelumnya, setelah perhatian tertuju pada model AI perusahaan karena biaya pelatihan yang lebih rendah. Pendirinya, Liang Wenfeng, mengendalikan hampir 90% perusahaan.
DeepSeek memutuskan mencari pendanaan setelah para pesaing mencoba merekrut peneliti dengan menawarkan saham perusahaan sebagai insentif. Dana Investasi Industri Sirkuit Terpadu China (China Integrated Circuit Industry Investment Fund) dapat memimpin putaran pendanaan, sementara Tencent dan Alibaba juga dilaporkan sedang dalam pembicaraan untuk ikut berpartisipasi.
Model V4 DeepSeek dilaporkan mampu tampil setara dengan model-model teratas dari OpenAI dan Anthropic pada pengujian benchmark, menurut perusahaan. Keunggulan kompetitif juga meluas ke harga: V4-Pro berharga 1,74 dolar AS per 1 juta token masukan, sementara V4-Flash berharga sekitar 0,14 dolar AS per 1 juta token masukan—jauh di bawah harga untuk model AS yang sebanding.
Struktur biaya yang lebih rendah berasal dari arsitektur DeepSeek yang efisien dalam komputasi, termasuk desain mixture-of-experts (MoE) yang hanya mengaktifkan sebagian model untuk setiap tugas, sehingga mengurangi kebutuhan komputasi saat inferensi. Menurut DeepSeek, V4-Pro menggunakan 27% daya komputasi dan 10% memori yang diperlukan oleh V3.2.
Putaran pendanaan DeepSeek terjadi saat China berupaya membangun infrastruktur AI yang lebih mandiri sebagai respons terhadap kontrol ekspor AS untuk chip canggih. V4 adalah model pertama DeepSeek yang disetel untuk chip-chip China seperti lini Ascend milik Huawei, meski laporan teknis perusahaan menunjukkan bahwa chip China menangani inferensi, sementara pelatihan mungkin masih bergantung terutama pada perangkat keras Nvidia.
DeepSeek juga merilis model open-weight—parameter terlatih yang dapat digunakan, di-fine-tune, dan dideploy oleh pihak lain—untuk memperluas pengembangan AI di luar dominasi AS. Strategi ini menekankan efisiensi algoritmik dibanding akses eksklusif ke perangkat keras AS paling canggih, meski dorongan AI China tetap bergantung sebagian pada perangkat keras Nvidia.