Le modèle vidéo IA de nouvelle génération de ByteDance avec le système de référence @ révolutionnaire. Combinez texte, images, clips vidéo et audio dans une seule instruction. Synchronisation audio-vidéo native, montage V2V et résolution jusqu'en 2K à 30fps — le tout dans une génération unifiée.
Seedance 2.0 est le modèle de génération vidéo IA le plus avancé de ByteDance, dévoilé en février 2026. Il adopte une architecture unifiée de génération conjointe audio-vidéo multimodale prenant en charge 4 modalités d'entrée simultanément — texte, jusqu'à 9 images, jusqu'à 3 clips vidéo et jusqu'à 3 pistes audio. Le système de référence @ révolutionnaire vous permet de taguer des éléments spécifiques dans votre instruction et de les lier à des références téléchargées pour un contrôle granulaire des mouvements de caméra, de l'apparence des personnages, du rythme audio et du style visuel. Les sorties atteignent la résolution 2K avec un audio natif synchronisé, incluant le synchronisé labial multilingue, les effets sonores et la musique de fond.
Taguage de référence révolutionnaire utilisant les labels @Image, @Video et @Audio dans votre instruction. Liez des éléments spécifiques à des fichiers téléchargés pour un contrôle précis des mouvements de caméra, des actions des personnages, du rythme audio et du style visuel.
Combinez du texte, jusqu'à 9 images, jusqu'à 3 clips vidéo et jusqu'à 3 pistes audio dans une seule requête de génération. Seedance 2.0 est le premier modèle à traiter les quatre types d'entrée simultanément.
La synthèse conjointe audio-vidéo produit des dialogues synchronisés labialement, des effets sonores et une musique de fond synchronisés avec la sortie visuelle. Prend en charge le synchronisé labial multilingue avec une précision au niveau phonémique.
Modifiez des vidéos existantes via le mode référence-vers-vidéo. Transférez les motifs de mouvement, les trajectoires de caméra et le rythme des clips téléchargés. Changez les tenues, modifiez les actions ou remplacez des éléments tout en préservant la structure originale.
Sortie native 2K (2048x1080) à 30fps avec plusieurs niveaux de qualité : 480p, 720p et 1080p. La durée de la vidéo varie de 4 à 15 secondes par génération.
Téléchargez plusieurs images de référence du même personnage sous différents angles. Seedance 2.0 maintient des visages, vêtements, proportions corporelles et accessoires cohérents sur plusieurs clips générés.
Découvrez les capacités de Seedance 2.0 en matière de contrôle de référence multimodal, de génération audio native et de montage vidéo

“@Image1 traverse @Image2 avec le mouvement de caméra de @Video1 et la musique de fond de @Audio1”
Instruction multi-référence combinant toutes les modalités

“Le personnage @Image1 danse au rythme de @Audio1 dans l'environnement @Image3”
Mouvement du personnage guidé par le rythme audio de référence

“Une personne faisant une présentation avec un discours en anglais synchronisé et des transitions de diapositives”
Dialogue synchronisé labialement avec contenu visuel

“Tutoriel de cuisine avec narration étape par étape et sons ambiants de cuisine”
Narration synchronisée avec les actions culinaires
Seedance 2.0 FAQ
Le système de référence @ vous permet de taguer des éléments de votre instruction avec les labels @Image1, @Video1, @Audio1 et de les lier à des fichiers de référence téléchargés. Seedance 2.0 extrait les mouvements de caméra des références vidéo, les rythmes des références audio et les styles de composition des images. Cela vous donne un contrôle granulaire sur chaque aspect de la vidéo générée.
"Le système de référence @ est véritablement révolutionnaire. Je peux extraire les mouvements de caméra d'un clip de référence et les appliquer instantanément — c'est un flux de travail créatif complètement nouveau."
Réalisateur vidéo
"L'entrée à 4 modalités change la donne. Je peux intégrer un design de personnage, une référence de mouvement de caméra et une musique de fond dans une seule instruction et obtenir exactement ce que j'avais imaginé."
Motion designer
"Le système de référence @ est véritablement révolutionnaire. Je peux extraire les mouvements de caméra d'un clip de référence et les appliquer instantanément — c'est un flux de travail créatif complètement nouveau."
Réalisateur vidéo
"L'entrée à 4 modalités change la donne. Je peux intégrer un design de personnage, une référence de mouvement de caméra et une musique de fond dans une seule instruction et obtenir exactement ce que j'avais imaginé."
Motion designer