Phare de ByteDance

Seedance 2.0

Le modèle vidéo IA de nouvelle génération de ByteDance avec le système de référence @ révolutionnaire. Combinez texte, images, clips vidéo et audio dans une seule instruction. Synchronisation audio-vidéo native, montage V2V et résolution jusqu'en 2K à 30fps — le tout dans une génération unifiée.

About

À propos de Seedance 2.0

Seedance 2.0 est le modèle de génération vidéo IA le plus avancé de ByteDance, dévoilé en février 2026. Il adopte une architecture unifiée de génération conjointe audio-vidéo multimodale prenant en charge 4 modalités d'entrée simultanément — texte, jusqu'à 9 images, jusqu'à 3 clips vidéo et jusqu'à 3 pistes audio. Le système de référence @ révolutionnaire vous permet de taguer des éléments spécifiques dans votre instruction et de les lier à des références téléchargées pour un contrôle granulaire des mouvements de caméra, de l'apparence des personnages, du rythme audio et du style visuel. Les sorties atteignent la résolution 2K avec un audio natif synchronisé, incluant le synchronisé labial multilingue, les effets sonores et la musique de fond.

Fonctionnalités clés de Seedance 2.0

Système de référence @

Taguage de référence révolutionnaire utilisant les labels @Image, @Video et @Audio dans votre instruction. Liez des éléments spécifiques à des fichiers téléchargés pour un contrôle précis des mouvements de caméra, des actions des personnages, du rythme audio et du style visuel.

Entrée 4 modalités

Combinez du texte, jusqu'à 9 images, jusqu'à 3 clips vidéo et jusqu'à 3 pistes audio dans une seule requête de génération. Seedance 2.0 est le premier modèle à traiter les quatre types d'entrée simultanément.

Synchronisation audio-vidéo native

La synthèse conjointe audio-vidéo produit des dialogues synchronisés labialement, des effets sonores et une musique de fond synchronisés avec la sortie visuelle. Prend en charge le synchronisé labial multilingue avec une précision au niveau phonémique.

Montage vidéo V2V

Modifiez des vidéos existantes via le mode référence-vers-vidéo. Transférez les motifs de mouvement, les trajectoires de caméra et le rythme des clips téléchargés. Changez les tenues, modifiez les actions ou remplacez des éléments tout en préservant la structure originale.

Résolution 2K et 30fps

Sortie native 2K (2048x1080) à 30fps avec plusieurs niveaux de qualité : 480p, 720p et 1080p. La durée de la vidéo varie de 4 à 15 secondes par génération.

Cohérence du personnage multi-plan

Téléchargez plusieurs images de référence du même personnage sous différents angles. Seedance 2.0 maintient des visages, vêtements, proportions corporelles et accessoires cohérents sur plusieurs clips générés.

Galerie officielle

Découvrez les capacités de Seedance 2.0 en matière de contrôle de référence multimodal, de génération audio native et de montage vidéo

Instruction multi-référence combinant toutes les modalités

Système de référence @

“@Image1 traverse @Image2 avec le mouvement de caméra de @Video1 et la musique de fond de @Audio1”

Instruction multi-référence combinant toutes les modalités

Mouvement du personnage guidé par le rythme audio de référence

Système de référence @

“Le personnage @Image1 danse au rythme de @Audio1 dans l'environnement @Image3”

Mouvement du personnage guidé par le rythme audio de référence

Dialogue synchronisé labialement avec contenu visuel

Génération audio native

“Une personne faisant une présentation avec un discours en anglais synchronisé et des transitions de diapositives”

Dialogue synchronisé labialement avec contenu visuel

Narration synchronisée avec les actions culinaires

Génération audio native

“Tutoriel de cuisine avec narration étape par étape et sons ambiants de cuisine”

Narration synchronisée avec les actions culinaires

FAQ Seedance 2.0

Seedance 2.0 FAQ

01Qu'est-ce que le système de référence @ dans Seedance 2.0 ?

Le système de référence @ vous permet de taguer des éléments de votre instruction avec les labels @Image1, @Video1, @Audio1 et de les lier à des fichiers de référence téléchargés. Seedance 2.0 extrait les mouvements de caméra des références vidéo, les rythmes des références audio et les styles de composition des images. Cela vous donne un contrôle granulaire sur chaque aspect de la vidéo générée.

02Quelles modalités d'entrée Seedance 2.0 prend-il en charge ?

Seedance 2.0 prend en charge 4 modalités d'entrée simultanément : des instructions textuelles (longueur illimitée), jusqu'à 9 images de référence (≤30MB chacune), jusqu'à 3 clips vidéo (2-15s de durée totale, ≤50MB chacun) et jusqu'à 3 pistes audio (≤15s au total, ≤15MB chacune). Limite totale de fichiers : 12 fichiers par requête.

03Quelles sont la résolution et la durée prises en charge ?

Seedance 2.0 produit une sortie native 2K (2048x1080) à 30fps avec plusieurs niveaux de qualité : 480p, 720p et 1080p. La durée de la vidéo varie de 4 à 15 secondes par génération. Les rapports d'aspect pris en charge incluent le paysage, le portrait et l'ultra-large 21:9.

04Comment fonctionne la génération audio native ?

Seedance 2.0 utilise une architecture à deux branches qui traite les latences vidéo et audio en parallèle. L'audio est généré simultanément avec les visuels, garantissant une synchronisation à la milliseconde près. Il prend en charge les dialogues avec synchronisé labial multilingue, les effets sonores adaptés aux actions et la musique de fond adaptée à l'ambiance. Vous pouvez également télécharger des références audio comme entrée.

05Qu'est-ce que le montage V2V (Vidéo-à-Vidéo) ?

Le montage V2V vous permet de télécharger des clips vidéo existants comme référence et de générer de nouvelles vidéos qui héritent de leurs motifs de mouvement, trajectoires de caméra et rythme. Vous pouvez modifier des éléments spécifiques comme les tenues, les actions ou les détails de scène tout en préservant la structure de mouvement d'origine.

06Comment Seedance 2.0 se compare-t-il à Seedance 1.5 Pro ?

Seedance 2.0 ajoute des entrées de référence vidéo et audio, passe de 1 à 9 références image, introduit le système de référence @ pour le contrôle multimodal, ajoute le montage vidéo V2V, étend la résolution maximale de 1080p à 2K, augmente la durée de 12s à 15s et est environ 30% plus rapide que 1.5 Pro.

07Quel modèle de tarification Seedance 2.0 utilise-t-il ?

Seedance 2.0 utilise une tarification dynamique à la seconde basée sur la résolution : 480p (14-28 crédits/seconde), 720p (28.5-57 crédits/seconde) et 1080p (640-3 810 crédits/seconde). Deux variantes de vitesse sont disponibles : Standard et Rapide, cette dernière étant environ 30% plus rapide.

08À qui s'adresse Seedance 2.0 ?

Seedance 2.0 est idéal pour les réalisateurs vidéo ayant besoin d'un contrôle précis du mouvement, les créateurs de contenu souhaitant une synchronisation audio native sans post-production, les annonceurs produisant du contenu vidéo de marque, les éducateurs créant des tutoriels narrés et toute personne ayant besoin d'une vidéo IA de qualité professionnelle avec un son synchronisé.

Ce que les créateurs disent de Seedance 2.0

“Le système de référence @ est véritablement révolutionnaire. Je peux extraire les mouvements de caméra d'un clip de référence et les appliquer instantanément — c'est un flux de travail créatif complètement nouveau.”

Alex Kim

Réalisateur vidéo

“La synchronisation audio native fait gagner des heures de post-production. La qualité du synchronisé labial est étonnamment précise même avec des dialogues non anglophones.”

Priya Sharma

Créatrice de contenu

“Le montage V2V me permet d'améliorer des séquences existantes sans avoir à tout retourner. Seedance 2.0 est désormais un outil central de notre pipeline de production.”

Lucas Müller

Producteur publicitaire

“L'entrée à 4 modalités change la donne. Je peux intégrer un design de personnage, une référence de mouvement de caméra et une musique de fond dans une seule instruction et obtenir exactement ce que j'avais imaginé.”

Yuki Tanaka

Motion designer

“Les r?sultats sont faciles ? pr?senter comme direction visuelle.”

Marta W.

?ditrice visuelle

“Avec des prompts courts et pr?cis, les rendus sont plus r?guliers.”

Hugo L.

agence cr?ative

“C?est une bonne premi?re ?tape avant la retouche manuelle.”

Sofia N.

formatrice digitale

“Nous avons pu valider un style sans organiser une production compl?te.”

Paul B.

product manager

Explorer Plus de Modèles Vidéo IA

Veo 3.1 Générateur de Vidéos IA Gratuit

Nouveau

Veo 3.1 est le générateur de vidéos IA gratuit le plus avancé de Google DeepMind avec une génération audio native révolutionnaire. Créez des vidéos 1080p HD en ligne avec effets sonores, dialogues et audio ambiant synchronisés — sans filigrane, illimité. Jusqu'à 8 secondes par clip, extensible à 60+ secondes à 24 FPS.

Essayer

Wan 2.6

Nouveau

Wan 2.6 est le modèle de génération vidéo d'Alibaba qui produit des vidéos de haute qualité avec un support de styles variés, un mouvement fluide et une sortie cinématographique à partir de prompts textuels et d'images de référence.

Essayer

Sora 2

Sora 2 est le modèle phare de génération vidéo d'OpenAI, capable de produire des vidéos de haute qualité à partir de descriptions textuelles et d'images. Il comprend les compositions de scènes complexes, les interactions entre personnages, les mouvements de caméra et la physique du monde réel pour des résultats cinématographiques. Sora 2 représente un bond majeur dans la génération vidéo AI avec une meilleure cohérence temporelle, un support de durée plus long et une interprétation plus fidèle des prompts.

Essayer

Kling 2.6

Kling 2.6 est le dernier modèle de génération vidéo AI de Kuaishou, reconnu pour sa qualité de mouvement exceptionnelle et sa sortie cinématographique. Basé sur une modélisation spatio-temporelle avancée, Kling 2.6 produit des vidéos avec des mouvements de personnages fluides, des transitions de caméra dynamiques et des détails visuels riches. Il prend en charge la génération texte-vers-vidéo et image-vers-vidéo, en faisant un outil polyvalent pour les créateurs recherchant du contenu vidéo AI de qualité professionnelle.

Essayer

Grok Video

Nouveau

Grok Video (propulsé par Grok Imagine Video) est le modèle de génération vidéo de xAI intégré directement dans l'écosystème Grok. Propulsé par le moteur Aurora propriétaire, il convertit des descriptions textuelles ou des images statiques en clips vidéo courts avec audio synchronisé. Ce qui distingue Grok Video, c'est sa vitesse — les clips sont générés en secondes, pas en minutes — combinée à un accès aux données Web en temps réel pour des références visuelles actuelles et pertinentes. Le modèle privilégie la fidélité aux descriptions et la cohérence naturelle des mouvements, ce qui le rend idéal pour le contenu rapide sur les réseaux sociaux, le prototypage rapide et les flux de travail créatifs itératifs.

Essayer

HappyHorse

Nouveau

HappyHorse est le modèle vidéo IA nouvelle génération d'Alibaba, construit sur une architecture multimodale native. Un seul modèle unifié couvre quatre scénarios de production — texte-vers-vidéo, image-vers-vidéo, référence multi-image vers vidéo et édition vidéo en place — avec synthèse audio-vidéo native, sortie 720p/1080p et adaptation poussée à la publicité, au e-commerce, aux mini-séries et aux créations sociales.

Essayer

Commencez à créer avec Seedance 2.0

Découvrez Seedance 2.0 — le générateur vidéo le plus avancé de ByteDance, gratuitement en ligne

Essayer Seedance 2.0 gratuitement