Resemble AI lance DramaBox, un modèle de discours contrôlable de niveau directeur, sur Hugging Face aujourd’hui

ON1,18%
PROMPT0,63%
IN-0,17%

Beating a annoncé que Resemble AI a publié DramaBox, un modèle de génération de discours, sur Hugging Face aujourd’hui. Le modèle offre un contrôle de niveau réalisateur grâce à une syntaxe de prompt séparée : les utilisateurs saisissent le dialogue entre guillemets tout en précisant des indications de scène telles que des soupirs, des pauses ou des chuchotements en dehors des guillemets. Le modèle transforme ces indications en discours avec inflexions émotionnelles, plutôt que de les lire à voix haute.

DramaBox prend en charge le clonage vocal zero-shot avec seulement 10 secondes d’audio de référence et permet des prompts en langage naturel pour définir l’âge, l’accent et l’émotion du personnage. La sortie propose un audio stéréo en 48 kHz de qualité studio. Tous les audios générés incluent un filigrane Perth invisible, résistant à la compression MP3, ainsi qu’un traitement audio standard afin d’empêcher tout usage abusif des deepfakes.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire