Le sujet de l’empreinte environnementale de l’Internet est à la mode, à juste titre. Il est urgent d’en prendre conscience. Internet représente aujourd’hui 4% des émissions mondiales de CO2 contre 2,8% pour le transport aérien civil, et sa consommation énergétique augmente de 9 % par an. La vidéo en ligne génère 60 % des flux de données mondiaux et plus de 300 millions de tonnes de CO2 par an. Beaucoup d’articles et d’études lui sont consacrés, avec leur lot de vraies informations et d’approximations hasardeuses.
Faisons le point.
L’évolution de l’offre et de la demande
La vidéo en ligne se généralise, avec une qualité qui s’améliore constamment et une production qui se démocratise grâce à des outils de plus en plus performants accessibles et connectés.
Les habitudes évoluent. On publie facilement des vidéos sur les réseaux sociaux, on privilégie les tutoriels aux modes d’emploi et les visio-conférences remplacent les réunions présentielles.
Les bénéfices de la vidéo en ligne sont nombreux : Limitation des déplacements, gain de temps, support attractif et efficace, dématérialisation évitant la production de déchets, etc…
Les impacts sont également nombreux : Plus de stockage et de diffusion de données, c’est plus de consommation électrique et plus de génération de gaz à effet de serre.
La problématique du stockage
Le volume de stockage de vidéos destinées à être diffusées en ligne augmente avec …
- l’accroissement de l’offre, par la transformation digitale des supports traditionnels
- l’accroissement de la demande pour des contenus plus faciles d’accès et plus divertissants
- l’accroissement des performances des moyens de production et des terminaux de lecture qui multiplient le poids de chaque minute produite. En quelques années, on est passé de la HD à la 4K(UHD) puis à la 8K, en passant par le HDR et la 360VR…
- le développement des réseaux sociaux et la banalisation du média vidéo : “stories”, vidéos virales et messages vidéo… Tous ces contenus à vocation éphémère encombrent les plateformes qui les conservent à vie.
Le streaming adaptatif s’étant généralisé, chaque vidéo est transcodée et stockée en une multitude de sous-formats de résolutions inférieures, de manière à adapter le flux servi à la connexion dont dispose l’internaute. Plus la qualité de la source est élevée, plus le nombre de sous-formats sera important. Pour s’adapter à tous les terminaux, on réalisera parfois les transcodages avec plusieurs codecs différents (H264, VP9 et AV1 pour YouTube par exemple).
Quelques résolutions d’image standard :
Exemple d’”échelle d’encodage” classique pour une vidéo Full HD : Ici, on génère 7 transcodages par codec, dont le “poids” total est de 5,2Go par heure de vidéo (12,1Mbps de débit cumulé) :
La problématique de la diffusion
La quantité de données diffusées liée à des vidéos en ligne augmente avec la généralisation du haut et du très haut débit, sur les réseaux fixes et mobiles.
Broadcast vs. Unicast
Le consommateur n’a pas conscience de la nature et des impacts des changements technologiques. Depuis l’origine de la télévision, la diffusion se fait en mode “broadcast”: un seul signal est émis vers un réseau d’antennes ou de satellites, qu’il soit regardé par une personne ou plusieurs millions. Le coût de diffusion est indépendant de l’audience et son impact carbone se limite à la transmission du signal vers un satellite ou un réseau d’antennes hertziennes.
Avec la généralisation des “box” internet et du haut débit, une offre de “replay” et de vidéo à la demande s’est ajoutée à la diffusion “broadcast” traditionnelle (d’un point vers un nombre indéterminé de points). Il y a encore peu de temps, on faisait en sorte de ne pas manquer le début d’un épisode de série TV en première diffusion. Désormais, on sait que si on a manqué le début, on pourra regarder l’épisode en “replay”, ce qui est un progrès évident du point de vue du spectateur. Cependant, cette diffusion se fait en mode “unicast” (point à point) et nécessite une consommation énergétique conséquente dédiée à cette distribution individuelle de données.
En préférant le confort du replay, nous sommes responsables d’émissions individuelles de gaz à effet de serre qui n’existent pas lors d’une diffusion directe (TNT ou satellite). Nous voyons le confort de ce nouveau service, mais nous n’avons conscience ni de son prix, ni de son impact.
Dès lors, les usagers ne sont pas incités à faire preuve de modération dans leur comportement.
Qui doit faire l’effort ? Le diffuseur ou l’internaute ?
L’exemple de l’écoute de vidéos sur YouTube
Une étude de l’Université de Bristol publiée en mai dernier a évalué à 10M de tonnes d’équivalent CO2 la production de gaz à effets de serre de YouTube sur l’année 2016. Cela correspond à l’impact annuel d’une ville comme Francfort. Sur une base de 220g de CO2 rejetés en moyenne par Km pour un véhicule particulier, l’impact (mondial) annuel de YouTube est équivalent à 39 jours de rejets de l’ensemble du parc de véhicules particuliers en France. Ce n’est pas rien…
Les vidéos musicales représentent 27% de ce qui est consulté sur YouTube, mais entre 10 et 50% sont simplement écoutées sans être regardées. Si l’audio était diffusé seul, la réduction d’émissions de gaz à effets de serre serait comprise entre 100 et 600KT d’équivalent CO2 par an, soit 0,5 à 3,5 jours de circulation du parc Français de véhicules particuliers !
Faut-il demander aux internautes de quitter YouTube pour aller écouter leurs musiques sur des services de streaming audio en ligne ou faut-il demander à YouTube de ne diffuser que l’audio quand la vidéo n’est pas regardée?
L’exemple de l’ultra-haute définition
Pour revenir à la taille des images, plusieurs études ont démontré qu’à une distance supérieure à une fois et demie la hauteur de l’écran, il est impossible de percevoir une amélioration de qualité au delà de la résolution HD (1920 x 1080 pixels).
En d’autres termes, si vous êtes assis à 3m de votre téléviseur, votre écran devra mesurer au moins 2m en hauteur pour que vous puissiez distinguer une image 4K d’une image HD. Si vous êtes assis à 1m de votre écran d’ordinateur, il faudra qu’il mesure au moins 67cm de haut et si vous tenez votre smartphone à 50cm, la largeur de son écran devra être d’au moins 33cm!
Voting with your Eyes, extrait de la lettre Tech-i de l’European Broadcasting Union, N°39, Mars 2019 :
Distances (en pieds) à partir desquelles l’augmentation de résolution est perceptible,
selon la diagonale de l’écran (en pouces)… [source] :
Notons que la résolution (et le poids) des contenus ne cesse d’augmenter alors que la taille moyenne des terminaux de consultation ne cesse de diminuer avec une consultation de plus en plus mobile.
De la HD à la 4K HDR…
- La résolution est multipliée par 4
- La fréquence d’image est multipliée par 2
- La HDR (codage des couleurs sur 10 bits au lieu de 8) multiplie le débit par 1,25 => Le débit d’encodage et de diffusion est multiplié par 10 pour un gain de qualité qui n’est pas perceptible.
Il faut donc entre 25 et 50Mbps de bande passante pour voir de la 4K HDR sur internet. La HD se contente de 6Mbps pour une qualité perçue identique.
Faut-il demander aux internautes de choisir un flux de résolution inférieure à la capacité de leur équipement ou faut-il limiter la résolution qui leur est diffusée, sachant que la “qualité d’expérience” sera inchangée ?
Les prochaines étapes
L’objet de notre réflexion est donc
- d’évaluer précisément l’impact environnemental de la vidéo en ligne, tant au niveau du stockage que de la diffusion
- d’imaginer des moyens de le réduire au niveau de la plateforme, plutôt que d’espérer un changement de comportement des utilisateurs (Déplacer l’effort de sobriété numérique “côté serveur”)
- de proposer des bonnes pratiques simples aux entreprises soucieuses de réduire leur empreinte carbone
- de mettre en place une labellisation ou une charte en partenariat avec des organisations référentes en matière de bilan carbone, d’analyse de cycle de vie et d’IT (The Shift Project, Collectif GreenIT, Ademe, CRiP) afin d’encourager les entreprises à mettre en oeuvre un streaming responsable.