
En quelques mois, les meilleures plateformes technologiques de production de vidéos générées par l’IA sont passées des Etats-Unis à la Chine. Comme les batteries électriques… mais en mode accéléré.
Est-ce un mouvement inéluctable ?
Viuz a enquêté sur ce phénomène passé un peu en dessous des radars.
Changement de paradigme
Il y a deux ans, les pionniers de la vidéo AI ne juraient que par Sora d’Open AI, Luma de Gen 3 ou encore Google Veo. Mais la vitalité des modèles a vite été bridée par les conditions d’accès, les droits d’auteurs et les coûts d’infrastructures exponentiels supportés par les plateformes.
Une brèche dans laquelle se sont enfoncées les grandes plateformes Asiatiques : Kuaishou (Kling AI), Bytedance, société mère de TikTok avec Seadance 2.0 (Jiemeng), ou encore Hunyuan Video, le modèle Open Source de Tencent
Le grand différenciateur pour les réalisateurs de vidéo IA ? La percée technologique du “Dual Branch Diffusion Transformer” proposé par Bytedance : le modèle génère la vidéo et l’audio synchronisées en un seul passage. Un gain de temps considérable pour les producteurs de vidéo IA.
Le marché asiatique
Le marché encore balbutiant de la génération de vidéo par IA (755 Millions de dollars en 2025) devrait croître de 20% par an pour atteindre les 3,4 milliards de dollars en 2033 selon les données de Grand View Research. D’ores et déjà l’Asie représente la plus grande partie des revenus avec avec plus de 30% du marché.
C’est encore l’Asie qui a dominé l’approche très pragmatique de l’essor de la vidéo AI. Alors que les modèles américains visaient une production très Hollywood / Longs métrages, les acteurs asiatiques ont collé à la demande de clipping et de micro-dramas.
Le dynamisme du marché Asiatique a également été favorisé par la large adoption des “doubles virtuels” par les influenceurs locaux. Et la mise à disposition des modèles de Gens AI vidéo en Open Source pour les petits et moyens studios initiée par Tencent.
La bataille des prix et des modèles
Le dernier élément décisif de captation du marché a été une séquence de baisse de prix brutale et difficile à suivre par les américains : baisse de 97% de prix du modèle d’AI vidéo Alibaba, Tongyi Qianwen (Qwen). Baisse de 99% du pricing des modèles de TikTok par rapport à ses concurrents US. Mise à disposition gratuite du modèle Ernie de Baidu.
Déjà la bataille se déplace vers les plateformes graphiques intégrant les API de ces modèles. La vraie guerre ne se situe plus seulement au niveau infra des modèles mais dans les wrappers qui utilisent les API en couches applicatives pour créer les agents vidéos de demain. Adobe par exemple intègre Kling et Veo.
Et l’Europe dans tout ça ?
Bien plus respectueuse du copyright des artistes, elle semble largement absente de ce choc des Titans.
Quelques startups comme l’allemand Black forest déjà valorisé, 3 milliards d’euros tentent de creuser le sillon des images réalistes. De même que l’anglais Synthesia qui s’était taillé un succès d’estime dans la génération d’avatars IA…
Mais ça, c’était avant la déferlante de Heygen monté par Joshua Xu, un ex de Snap et Wayne Liang de TikTok.
In fine, en termes de Géopolitique de la vidéo IA, les Etats-Unis semblent s’être enracinés sur le texte tandis que la Chine se concentrait sur l’image. Et si le fameux adage “une image vaut 1000 mots” est toujours exact, la Chine semble avoir déjà gagné une bataille décisive…avec une génération d’avance.
Photo de Declan Sun sur Unsplash
