Berdasarkan pemantauan Beating, sebuah klaim viral baru-baru ini menyebut bahwa memasukkan token khusus seperti <|begin_of_sentence|> di kotak chat DeepSeek dapat mengekspos percakapan pengguna lain, yang diberi label sebagai kegagalan isolasi multi-tenant level P0. Faktanya, fenomena ini tidak ada kaitannya dengan isolasi data. Saat dipicu dengan token seperti itu, model masuk ke pola format yang dipelajari pada waktu pelatihan dan menghasilkan dialog hasil karangan berdasarkan memori serta prompt sistemnya sendiri—bukan pengambilan real-time dari sesi lain. Ini adalah Training Data Extraction, kerentanan bersama pada semua model bahasa besar, bukan sesuatu yang unik untuk DeepSeek. Google DeepMind menerbitkan riset pada 2023 yang menunjukkan bahwa input khusus dapat mengekstraksi data pelatihan dari GPT dan PaLM. Paper Magpie ICLR 2025 secara langsung memanfaatkan mekanisme ini. Klaim bahwa konten yang bocor mencakup tanggal hari ini tidak membuktikan kegagalan isolasi multi-tenant, karena DeepSeek memasukkan tanggal saat ini dalam prompt sistemnya, dan model secara alami mengintegrasikannya ke dalam output yang dihasilkan.