ByteDance Merilis Sumber Terbuka Model Multimodal 3B Lance yang Dilatih dengan 128 GPU A100

Menurut Beating, riset ByteDance membuka-sumberkan Lance, model multimodal terpadu dengan 3 miliar parameter yang dilatih hanya dengan 128 GPU A100. Lance mendukung pemahaman, pembuatan, dan pengeditan gambar serta video dalam satu kerangka kerja, menunjukkan bahwa kemampuan multimodal tingkat lanjut dapat dicapai dengan sumber daya komputasi minimal dengan menggunakan arsitektur dual-stream mixture-of-experts dan modal-aware rotary position encoding.
Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar