IA génératives et réduction de l’impact carbone des vidéos

Contexte et enjeu des vidéos IA génératives

Le marché de la vidéo IA générative est en forte croissance. Les dernières estimations évaluent la taille du marché à 2,3 Milliards de dollars d’ici 2033 (contre 336 millions en 2023) soit une croissance X9 en 10 ans. 

La vidéo générative trouve aujourd’hui des terrains d’application dans différents secteurs comme : le divertissement, la publicité, les jeux et la réalité virtuelle. 

Les entreprises sont en demande croissante de contenu vidéo mais à des prix abordables. Parallèlement, les solutions de création vidéo se démocratisent et permettent aujourd’hui de produire du contenu vidéo de qualité en mode “content factory” pour des stratégies d’inbound marketing mais pas seulement. 

Elles s’engagent aujourd’hui avec plus ou moins de moyens dans la création d’IA Factory. 

L’objectif de ces IAFactory est de :

  • Démocratiser l’usage de l’IA au sein de l’entreprise, en facilitant l’adoption de cette technologie par les différentes équipes et en accélérant la transformation numérique. Cela inclut :
  • Tester rapidement des projets : permettre des cycles rapides de développement et de validation de concepts (Proof of Concept, POC).
  • Évangéliser les équipes : sensibiliser et former les employés à l’utilisation de l’IA.
  • Développer des solutions sur mesure : Créer des applications IA adaptées aux besoins spécifiques de l’entreprise.

Quel rôle pour les IA génératives “GenAI” vidéo ?

Ces IA permettent de rationaliser les processus de production, réduire les coûts, et améliorer la créativité. Ces IA sont avant tout adoptées par les créateurs de contenus, les experts du marketing, et les studios de production. Les IA génératives permettent aujourd’hui de faire du montage vidéo automatisé, de la génération de scènes, des animations de personnages, des effets spéciaux, de la retouche vidéo, et de créer des videos de haute qualité. Le développement des plateformes de streaming et la dynamique des médias sociaux vers toujours plus de vidéo soutiennent cette demande toujours plus importante de contenus vidéo.

Les IA génératives rendent possibles et accessibles de nouvelles possibilités créatives et repoussent ainsi les limites de la création de contenu vidéo. 

En terme d’évaluation des gains de productivité, des premières estimations ont été effectuées pour les vidéos de formation. Le gain de temps et de budget est de l’ordre de 80% par rapport aux méthodes de création de vidéo traditionnelles.  

Une adoption rapide des IA génératives 


Actuellement les solutions se multiplient: Runway, Sora, HeyGen, Lumen5, Deepbrain… Des centaines de solutions sont aujourd’hui disponibles.  Des défis restent à régler mais n’empêchent pas pour autant leur adoption : confidentialité des données, droits d’auteur, fake vidéos.

Cependant, des solutions à ces problèmes apparaissent : intégration des auteurs à la contribution et à l’entraînement des modèles (les auteurs étant également intéressés pour les intégrer à leur processus créatif), la capacité de plus en plus pertinente des outils à opérer de manière efficace.

C’est aussi la cohérence dans le déroulé des vidéos et le respect des identité de marque, la possibilité de modifier les vidéos jusqu’à obtenir le bon résultat. Ces solutions ont la capacité de renforcer des infrastructures à produire rapidement des vidéos de qualités même si pour l’instant les vidéos restent souvent limitées à des durées max de 1 à 2 min. Ceci représente d’un point de vue computationnel un très grand nombre de frame vidéos à générer.

Qui a recours massivement aux vidéos IA génératives  : le persona type  

  • Le segment marketing capte 34% des parts de marché (publicité, vidéos promotionnelles, démos produits)
  • Les grandes entreprises représentent 60% de la demande : elles ont en effet des besoins forts de localisation rapide des vidéos pour différentes régions et langues, elles ont également des ensembles de données plus complexes et multiformes que l’IA générative peut utiliser pour créer du contenu vidéo hautement personnalisé et ciblé
  • Amérique du nord représente 42% (Marché de 141 millions de dollars)
  • Les IA génératives reposent majoritairement sur le cloud : 55% des parts
Part de marché de l’IA générative dans la création vidéo

Les vidéos IA génératives sont-elles éco-responsables ?

Les modèles d’IA sont lourds à entraîner (on parle de 552 tonnes CO2 pour GPT3, selon l’étude Luccioni et al 2022 citée dans le rapport de référence sur l’IA Stanford Ai Index de 2024)

Le cas GPT 4

Le processus de formation du GPT-4 a fait appel à environ 25 000 GPU Nvidia A100 [1]. Avec une puissance thermique (Thermal Design Power) de 400 watts chacun, ces GPU constituent l’épine dorsale de la puissance de calcul nécessaire à la formation des LLM aujourd’hui.

En multipliant le TDP d’un seul GPU A100 par le nombre de GPU utilisés, on obtient une consommation d’énergie de 10 000 kWh pour l’ensemble des 25 000 GPU. Pour la période d’entraînement de 100 jours de GPT-4, cela représente la somme colossale de 24 000 000 kWh.

Toutefois, ces chiffres ne représentent que la partie émergée de l’iceberg. Dans le monde réel, les centres de données qui hébergent ces GPU ne sont pas parfaitement efficaces. Il y a des demandes d’énergie supplémentaires de la part du matériel de soutien comme les CPU, la mémoire, l’éclairage et l’infrastructure de refroidissement. Nous ajoutons 20 % à nos calculs initiaux de consommation d’énergie pour en tenir compte [2]. Cet ajustement porte notre consommation totale d’énergie à un niveau encore plus stupéfiant de 28 800 000 kWh.

Les implications environnementales d’une telle consommation d’énergie sont significatives. Étant donné que le facteur d’émission de carbone d’Azure West – où GPT-4 a probablement été formé, étant donné le partenariat d’OpenAI avec Microsoft – est de 0,24 kg d’équivalent CO2 par kWh, nous pouvons estimer le total des émissions de carbone pour la formation de GPT-4 [3]. Ce calcul aboutit à environ 6 912 000 kilogrammes (ou 6912 tonnes métriques) d’émissions d’équivalent CO2.

Pour mettre cela en perspective, c’est l’équivalent de la conduite d’une voiture à essence sur près de 18 millions de kilomètres ou l’équivalent de l’alimentation de plus de 1300 foyers pendant un an [4]. 

Une modélisation de l’impact carbone à rapporter au nombre de vidéos produites (en intégrant les coûts en émission de CO2 d’une production traditionnelle)

Une étude de la revue scientifique Nature, sous forme d’analyse comparative, donne quelques éléments complémentaires pour analyser l’impact et évaluer les émissions de CO2 :

Pour les images, il semble que les images produites en IA génératives s’en sortent plutôt pas mal par rapport à leur homologue réalisées de manières traditionnelles (déplacement d’un photographe ou d’une équipe, création par des illustrateurs).  

Pour les vidéos, l’impact se révèle néanmoins bien plus important. Pourquoi?

En effet, une vidéo de 2 minutes à 30 images par secondes représente 3 600 trames à calculer ce qui augmente beaucoup l’impact carbone par rapport aux images. Il est possible cependant que dans certains cas, cet impact demeure bien que élevé encore inférieur à celui de tournages en physique avec de grosses équipes.

Le gros problème est que la facilité de création des vidéos et la réduction du temps nécessaire à les produire risquent de générer une tendance à en produire de plus en plus, avec un effet au global plus important que via les productions traditionnelles. C’est ce qu’on peut constater avec l’usage de réseaux sociaux (12 Milliards de vidéo diffusées chaque jour sur Youtube et Facebook). Quel sera l’impact global lorsque les entreprises, les créateurs de contenus et les consommateurs vont produire 10 ou 100 fois plus de vidéos? 

L’urgence de la décarbonation en sortie de création 

Ces vidéos seront ensuite diffusées sur les sites internet des marques, dans les newsletter, sur les plateformes de diffusion en streaming et sur les médias sociaux(Youtube, Meta, X). Ces diffusions seront sources d’impact carbone. 

Exemple : 1 vidéo de 100 Mo vue 1.000.000 de fois en France (Pays très décarboné avec son industrie nucléaire) est égale à 4,36 Tonnes CO2

Des grandes marques internationales, des plateformes de contenu vidéo (cf. Brut, Kombini..) pourront diffuser des milliers de videos de ce type par an. L’impact sur la planète sera très important. 

Comment limiter l’impact des vidéos IA génératives issues des IA

Par une production utile

La première réflexion à mener est de ne pas rentrer dans une frénésie de production de vidéos. Même si le temps de production des vidéos est divisé par 10, si les équipes commencent à en produire 30 voire 100 fois plus, il est fort probable que l’impact soit encore plus grand.

L’IA fait appel à des datas centers, utilise du GPU, implique des renouvellements fréquents des infrastructures cloud qui sont nécessaires pour maintenir rapidité, capacité de calcul et performance. 

Ceci risque largement de dépasser les impacts mesurés via les méthodes de production traditionnelles des vidéo : déplacement d’équipes de tournages, mises à disposition de matériel de tournage et consommation d’électricité lors des tournages. 

Par un encodage efficace des vidéos IA génératives avant diffusion avec réduction du poids (50 à 70% en moyenne) sans perte de qualité

Une diffusion éco-responsable

Vidmizer avec le GreenEncoder s’est donné pour mission de réduire le poids des vidéos (tous types de vidéo) sans perte qualité pour l’œil humain et ceci quelque soit le type de vidéos (publicitaires, contenu, films, éducation et génératives). 

Nos algorithmes ont pour caractéristique de trouver la meilleure combinatoire possible entre complexité des vidéos, réduction du poids, qualité perçue et le nombre d’itérations nécessaires pour arriver à l’encodage optimum. 

Cet algorithme “Smart” fait appel à la fois aux techniques de computer vision et à l’IA. Cette combinaison d’algorithmes permet de relever l’enjeu de décarbonation, tout en étant éco responsable à la fois dans le processus d’encodage (pas de boucles inutiles d’encodage, infrastructures cloud éco-responsables) et dans le résultat de l’encodage (50 à 70% en moyenne de réduction de poids au delà des encodages classiques), exportés par outils de montage ou via les IA génératives.   

Intéressé pour tester cette innovation et ajouter à vos AI Content Factory un filtre de décarbonation de vos vidéos avant de les diffuser ? Contactez-nous !

You May Also Like