Aller au contenu
Dirigeants 11 juin 2026 21 min de lecture

Empreinte environnementale de l'IA : les vrais chiffres selon votre usage

Eau, CO₂, électricité : que consomme réellement une requête IA ? Chiffres sourcés 2025-2026, du simple prompt au contexte de 800k tokens. Impact utilisateur vs datacenters, atout français, paradoxe de Jevons.

#environnement #empreinte-carbone #rse #coût-ia #tokens #souveraineté

“L’IA assèche les nappes phréatiques.” “Une requête ChatGPT consomme un demi-litre d’eau.” “Les datacenters vont engloutir l’électricité mondiale.”

Vous avez lu ces titres. Vos équipes aussi. Et certaines hésitent désormais à utiliser les outils que vous venez de déployer, par scrupule écologique sincère.

Le sujet mérite mieux que des slogans — dans les deux sens. L’empreinte de l’IA est un vrai sujet à l’échelle de l’infrastructure mondiale. Et en même temps, à l’échelle de votre usage, elle est presque toujours négligeable face à vos autres postes d’émissions. Les deux affirmations sont vraies simultanément. Cet article pose les chiffres — sourcés, notes en bas de page — pour qu’on puisse en parler sérieusement.

Ce qu’on sait vraiment (et ce qu’on ne sait pas)

Premier point d’honnêteté : OpenAI et Anthropic ne publient pas de mesures par requête pour GPT-5 ou Claude Opus. Les seuls chiffres officiels et mesurés viennent de deux acteurs :

  • Google (août 2025, étude méthodologique complète) : un prompt texte médian sur Gemini consomme 0,24 Wh d’électricité, émet 0,03 g de CO₂e et évapore 0,26 mL d’eau dans le datacenter. Soit l’équivalent de 9 secondes de télévision et 5 gouttes d’eau.1
  • Mistral (juillet 2025, première analyse de cycle de vie complète d’un LLM, réalisée avec le cabinet Carbone 4 et l’ADEME) : une réponse de 400 tokens sur Le Chat (Mistral Large 2) représente 1,14 g de CO₂e et 45 mL d’eau — en incluant l’entraînement du modèle, la fabrication du matériel et un périmètre eau beaucoup plus large.2

L’écart entre les deux (×38 sur le CO₂, ×170 sur l’eau) ne signifie pas que l’un ment : ils ne mesurent pas le même périmètre. Google mesure l’inférence et son datacenter ; Mistral inclut tout le cycle de vie. Côté estimations indépendantes, Epoch AI évalue une requête GPT-4o typique à ~0,3 Wh3, et Sam Altman a avancé 0,34 Wh et 0,32 mL d’eau par requête ChatGPT moyenne4.

Retenez la fourchette honnête pour une requête conversationnelle standard : 0,2 à 1 Wh, 0,03 à 1 g de CO₂e, et de quelques gouttes à quelques centilitres d’eau selon le périmètre retenu. Le chiffre de “50 cL d’eau par requête” qui circule correspond à des cas extrêmes ou à des périmètres très larges, pas à une moyenne.

Une nuance importante : ces chiffres médians concernent des petites requêtes. Dès qu’on travaille avec de gros contextes — et c’est tout l’intérêt de l’IA en entreprise — la consommation change d’échelle. C’est ce qu’on va chiffrer.

Votre usage, votre empreinte : 4 profils chiffrés

Les estimations ci-dessous s’appuient sur les travaux académiques récents (~0,4 Wh pour 1 000 tokens traités sur un grand modèle, davantage pour les tokens générés que pour les tokens lus). Ce sont des ordres de grandeur, volontairement en fourchette haute. Le CO₂ dépend du mix électrique : 21,7 g CO₂/kWh en France (record historique 20245) contre ~473 g en moyenne mondiale6 — on donne les deux.

Profil 1 — Usage personnel : la question du soir

“Donne-moi une recette avec ce qui reste dans mon frigo.”

Par requête
Électricité~0,3 Wh
CO₂e0,03 à 0,15 g
Eau< 1 mL (datacenter)

C’est l’équivalent de quelques secondes de télévision. Mille requêtes de ce type émettent moins qu’un kilomètre en voiture. À cette échelle, le débat individuel “ai-je le droit moral de poser cette question à ChatGPT ?” n’a pas de base physique.

Profil 2 — Pro débutant : un document de 20 pages

Vous téléchargez un contrat ou un rapport de 20 pages (~15 000 tokens) dans Claude ou ChatGPT et posez cinq questions dessus.

Par session
Électricité10 à 20 Wh
CO₂e~0,3 g (France) à 8 g (mix mondial)
Eau10 à 40 mL

L’équivalent de 100 à 150 mètres en voiture thermique. Si cette session vous évite d’imprimer le document ou un aller-retour de relecture, le bilan net est probablement positif.

Profil 3 — Pro intermédiaire : 20 requêtes par jour

L’usage quotidien typique d’un collaborateur équipé : mails, synthèses, reformulations, quelques documents.

Par jourPar an (220 j ouvrés)
Électricité15 à 30 Wh4 à 7 kWh
CO₂e0,1 kg (France) à 3 kg (mix mondial)
Eau20 à 100 mL5 à 20 L

Une année complète de cet usage émet moins que 20 km en voiture. Pour situer : un seul steak de bœuf représente 5 à 7 kg de CO₂e — davantage que l’année entière d’IA de ce collaborateur.

Profil 4 — Pro expert : agents et gros contextes

C’est notre cas chez Nefia, et celui de nos clients les plus avancés : des agents IA qui chargent un contexte métier complet (base de connaissance, CRM, historique) avant de travailler. Là, on ne parle plus de “requêtes” mais de tâches, et les volumes de tokens explosent.

TâcheTokens traitésÉlectricitéCO₂e (France / monde)
Petite (rédiger un compte rendu avec contexte)30-50k15 à 40 Wh~0,5 g / ~15 g
Moyenne (analyse multi-documents, génération d’un livrable)100-200k50 à 150 Wh~2 g / ~60 g
Importante (audit complet, refonte, agent longue durée)~800k300 à 800 Wh~12 g / ~300 g

Une journée chargée d’expert — deux grosses tâches, quelques moyennes — pèse 1 à 2 kWh. Sur une année, environ 300 kWh : la consommation annuelle d’un réfrigérateur.

En carbone, cette année d’usage intensif représente environ 7 kg de CO₂e si l’inférence tourne en France, 100 à 180 kg sur le mix mondial moyen. C’est le profil le plus lourd qui existe aujourd’hui — et il faut le mettre en face des bons comparateurs.

À vous de jouer : positionnez le curseur sur la taille de votre tâche, choisissez où tourne l’inférence, et regardez ce que ça donne.

⚡ Simulateur — l'empreinte d'une tâche IA
électricité
CO₂e
eau (selon périmètre)
Hypothèse volontairement haute : ~0,4 Wh / 1 000 tokens (cf. note méthodologique) · eau : 0,2 à 2 mL par Wh selon le périmètre retenu · équivalence voiture : 200 g CO₂e/km.

La comparaison qui remet les ordres de grandeur en place

PosteCO₂e
1 an d’usage IA intermédiaire (20 req/jour)0,1 à 3 kg
1 an d’usage IA expert intensif (mix mondial)100 à 180 kg
1 aller-retour Paris–New York (par passager)~1 800 kg
1 voiture thermique, usage moyen français (12 000 km)~2 400 kg
Empreinte annuelle moyenne d’un Français~9 000 kg

Le même tableau, en image — et c’est en passant sur l’échelle réelle qu’on comprend le sujet :

📊 Émissions annuelles comparées (kg CO₂e/an)
IA : fourchettes hautes de cet article · avion, voiture, empreinte moyenne : ordres de grandeur usuels (ADEME).

Lecture : l’usage IA le plus intensif imaginable représente moins de 10 % d’un seul vol transatlantique, et environ 5 % de la voiture du même collaborateur. Hébergé en France, il tombe sous 0,5 %.

Autrement dit : si votre politique RSE interdit l’IA mais rembourse les vols intérieurs et les déplacements en voiture individuelle, elle optimise le mauvais poste — avec un zèle inversement proportionnel à l’impact.

Impact utilisateur vs impact sociétal : ne pas confondre les deux étages

Tout ce qui précède raisonne par requête et par utilisateur. À cette échelle, le verdict est sans appel : l’impact est marginal. Mais c’est précisément là que le débat public déraille — on répond à une question d’infrastructure avec des arguments de comportement individuel, et inversement.

À l’échelle sociétale, les chiffres changent de nature :

  • Les datacenters ont consommé environ 415 TWh en 2024, soit 1,5 % de l’électricité mondiale, et l’AIE projette un doublement à ~945 TWh en 2030 — l’équivalent de la consommation électrique du Japon. L’IA est le principal moteur de cette croissance.7
  • L’eau est un vrai sujet, mais local : un datacenter implanté en zone de stress hydrique (Arizona, certaines régions d’Espagne ou du Chili) crée un conflit d’usage réel pour les habitants, même si “votre” requête n’y est pour rien individuellement. La variable décisive n’est pas le volume de prompts, c’est le choix d’implantation et la technologie de refroidissement.
  • L’entraînement des modèles et la fabrication du matériel (GPU, serveurs, bâtiments) pèsent lourd — c’est ce que l’ACV de Mistral rend visible2 — mais ils s’amortissent sur des milliards de requêtes.

La conséquence pratique : culpabiliser les utilisateurs est inefficace, et dédouaner les infrastructures est malhonnête. Les bons leviers ne sont pas au même étage. L’utilisateur optimise son usage (bon modèle, bon contexte — on y revient). Les questions qui comptent vraiment — où s’implantent les datacenters, avec quelle électricité, quel refroidissement, quelle transparence des fournisseurs — se jouent au niveau des opérateurs, des États et des régulateurs. C’est un débat de politique énergétique et d’aménagement, pas de morale individuelle.

Et sur ce débat-là, la France a une carte exceptionnelle à jouer.

La France, terre d’accueil naturelle des datacenters

Trois faits, tous issus du bilan électrique 2024 de RTE5 :

  1. L’électricité française est la plus décarbonée des grandes économies : 21,7 g CO₂/kWh en 2024, record historique, 95 % de production bas-carbone — grâce au nucléaire (~65 % de la production) et à l’hydroélectricité (~13 %).
  2. La France produit plus qu’elle ne consomme, massivement : 101,3 TWh exportés en 2024, solde net record de +89 TWh vers ses voisins européens. Autrement dit, la France dispose déjà d’un excédent d’électricité décarbonée supérieur à la consommation actuelle de tous les datacenters d’Europe.
  3. Cette électricité est pilotable (nucléaire + hydraulique), ce qui correspond exactement au besoin d’un datacenter : une charge stable, 24h/24.
🔌 Intensité carbone de l'électricité — 2024 (g CO₂/kWh)
Cliquez sur un pays pour voir ce qu'y émettrait une grosse tâche IA (800k tokens ≈ 0,5 kWh). Sources : RTE, Bilan électrique 2024 (France) · Ember, Global Electricity Review 2025 (États-Unis, Chine, monde).

La même tâche IA exécutée dans un datacenter français émet plus de 20 fois moins de CO₂ que sur le mix mondial moyen, et près de 26 fois moins qu’en Chine. C’est ce qui explique l’offensive lancée au Sommet pour l’action sur l’IA de Paris en février 2025 : 109 milliards d’euros d’investissements privés annoncés pour des infrastructures IA en France, 35 sites “clés en main” proposés par l’État à proximité du réseau électrique — et la formule restée célèbre d’Emmanuel Macron aux industriels : “plug, baby, plug”.8

Soyons complets, parce que c’est un article sur l’honnêteté des chiffres : accueillir des datacenters n’est pas gratuit. Foncier, artificialisation, raccordements, besoins en eau de refroidissement selon la technologie choisie, tension locale sur certains territoires — ces débats existent et sont légitimes. Mais d’un point de vue climatique global, chaque datacenter construit en France plutôt qu’en Virginie ou au Shandong est une émission divisée par 20. Si la demande mondiale est là de toute façon — et elle l’est — autant qu’elle s’installe sur l’électricité la plus propre disponible.

La courbe d’expérience : l’énergie par requête s’effondre

Deuxième dynamique que le débat public intègre mal : l’efficacité énergétique de l’IA progresse à une vitesse inédite. C’est une courbe d’expérience classique — chaque génération de matériel, de modèle et de logiciel d’inférence fait chuter le coût (énergétique et financier) de la requête :

  • Google a mesuré une division par 33 de l’énergie de son prompt médian — et par 44 des émissions — en douze mois (mai 2024 → mai 2025), à qualité de réponse supérieure.1
  • Les estimations académiques pour une requête GPT-4o (~0,3 Wh) sont dix fois plus basses que les chiffres qui circulaient encore en 2023 (~3 Wh), en partie parce que les premières estimations étaient grossières, en partie parce que les modèles et les puces se sont réellement améliorés.3

Visualisée, cette chute donne ceci :

📉 Énergie d'un prompt médian Gemini, mai 2024 → mai 2025 (Wh)
Points de départ et d'arrivée publiés par Google (division par 33 en 12 mois, à qualité de réponse supérieure) ; la trajectoire intermédiaire est une interpolation exponentielle illustrative. Survolez les points.

Mais cette courbe d’expérience n’est pas la même partout. Trois trajectoires se dessinent :

🇺🇸 États-Unis🇨🇳 Chine🇫🇷 France / Europe
StratégieFrontière absolue : les plus gros modèles, les plus gros datacenters (projet Stargate : 500 Md$ annoncés)Optimisation sous contrainte : l’embargo sur les puces avancées force l’efficienceModèles compacts, transparence, inférence décarbonée
EfficienceForte en valeur absolue, mais consommation totale maximaleRemarquable par modèle : DeepSeek-V3 entraîné en ~2,8 M d’heures de GPU bridés, une fraction du coût des modèles frontière américains9Bonne : modèles plus petits à performance comparable sur la plupart des usages pro
Mix électrique384 g CO₂/kWh, et des datacenters de plus en plus alimentés au gaz dédié6560 g CO₂/kWh : l’efficience logicielle est en partie annulée par le charbon621,7 g CO₂/kWh5
Bilan carbone par requêteMoyenMoyen malgré l’optimisationLe meilleur des trois

L’ironie de ce tableau : la Chine a les modèles parmi les plus optimisés au monde (par nécessité), mais les fait tourner sur le réseau le plus carboné. Les États-Unis ont le plus de moyens, mais une logique de force brute. La position française est singulière : Mistral n’a pas les plus gros modèles, mais combine des modèles efficients, la seule ACV complète publiée du secteur2, un hébergement européen compatible RGPD, et le réseau électrique le plus propre. Pour une entreprise française dont les usages sont des tâches métier (et non de la recherche de frontière), c’est une combinaison difficile à battre — on l’avait déjà noté sous l’angle souveraineté des données.

Courbe d’expérience vs paradoxe de Jevons : pourquoi la consommation totale montera quand même

Si l’énergie par requête est divisée par 33 en un an, le problème est réglé ? Non — et c’est le point le plus important de cet article.

En 1865, l’économiste William Stanley Jevons observait que les machines à vapeur plus efficaces n’avaient pas réduit la consommation de charbon de l’Angleterre : elles l’avaient explosée, parce que l’efficacité rendait la vapeur rentable pour mille nouveaux usages. C’est le paradoxe de Jevons, ou effet rebond.

L’IA est en train d’en livrer l’illustration la plus pure de l’histoire. Quand DeepSeek a démontré en janvier 2025 qu’on pouvait entraîner un modèle de pointe pour une fraction du coût supposé, les marchés ont paniqué sur les valeurs de l’IA — et Satya Nadella, CEO de Microsoft, a répondu en une phrase : “Jevons paradox strikes again! As AI gets more efficient and accessible, we will see its use skyrocket, turning it into a commodity we just can’t get enough of.”10 Chaque division du coût par requête multiplie le nombre de requêtes : c’est déjà ce qu’on observe, et les projections de l’AIE (945 TWh en 2030) intègrent déjà les gains d’efficience.7

Il faut donc dire les choses clairement : la croissance de la consommation totale de l’IA est inéluctable. Pas parce que la technologie serait incontrôlable, mais parce qu’aucun acteur ne peut se permettre de s’arrêter :

  • Géopolitique et militaire : la course entre Washington et Pékin a une dimension de défense assumée. Aucune des deux puissances ne ralentira pour des raisons climatiques.
  • Compétitivité économique : une entreprise — ou un pays — qui renonce à l’IA pendant que ses concurrents s’équipent transfère simplement la consommation (et la valeur ajoutée) chez eux. L’abstinence unilatérale ne réduit pas l’empreinte mondiale d’un watt ; elle déplace les gains de productivité.

La vraie question n’est donc pas “faut-il y aller ?” — personne n’a ce choix — mais “qui maîtrise qui ?”. Subir l’IA des autres : modèles américains ou chinois, données exportées, inférence sur des réseaux carbonés, dépendance technologique complète. Ou la maîtriser : et pour une entreprise française, la voie cohérente existe déjà — des modèles européens quand l’usage le permet (Mistral en tête), une inférence localisée sur l’électricité décarbonée française, et des usages pilotés plutôt que subis. C’est le seul scénario où souveraineté, compétitivité et climat pointent dans la même direction.

Le lien avec votre facture : l’économie suit l’énergie

Il y a une bonne nouvelle cachée dans le modèle économique de l’IA : le prix que vous payez est corrélé au calcul consommé, donc à l’énergie.

En forfait (ChatGPT Plus, Claude Pro à ~20 €/mois, formules Max à 100-200 €) : le signal prix est masqué, mais les limites d’usage plafonnent de fait la consommation. Un collaborateur en forfait à 20 € ne peut physiquement pas devenir un poste d’émission significatif.

En API (paiement au token) : chaque token traité est facturé. Votre facture API est donc un proxy direct de votre empreinte. Concrètement :

  • Une tâche qui recharge inutilement 200 pages de contexte à chaque appel coûte plus cher et consomme plus. L’optimiser (mise en cache du contexte, contexte propre) réduit les deux d’un même geste.
  • Choisir un petit modèle pour une tâche simple (tri, extraction, classification) plutôt qu’un modèle frontière divise le coût — et l’énergie — par 10 à 30.
  • Un livrable généré une fois et réutilisé cinquante fois bat cinquante régénérations.

C’est un cas rare où l’incitation économique et l’incitation écologique pointent exactement dans la même direction. Une équipe qui pilote sa consommation de tokens — ce qu’on recommande de toute façon pour maîtriser le coût de l’IA — pilote son empreinte sans effort supplémentaire.

Ce qu’on recommande concrètement

  1. Ne culpabilisez pas les petits usages. Une question à ChatGPT pèse quelques secondes de télévision. L’auto-censure sur ce terrain est de l’énergie morale mal investie.
  2. Le bon modèle pour la bonne tâche. C’est le levier n°1, à la fois économique et environnemental : réservez les modèles frontière aux tâches qui le justifient.
  3. Soignez vos contextes. Pas de re-upload systématique du même document, du caching sur les workflows répétitifs, des bases de connaissance propres. Moins de tokens = moins d’euros = moins de watts.
  4. Privilégiez l’inférence européenne quand c’est possible. Mix à 21,7 g CO₂/kWh, souveraineté, latence : trois bénéfices pour un choix.
  5. Mesurez. Suivez votre consommation de tokens comme vous suivez vos frais de déplacement. Le jour où une partie prenante vous interroge sur votre usage IA, vous répondez avec des chiffres — comme cet article — au lieu de promesses.
  6. Gardez les ordres de grandeur en tête dans vos arbitrages RSE. Un seul aller-retour en avion évité compense des années d’usage IA de toute une équipe. Optimisez dans cet ordre.

L’empreinte de votre usage IA, on sait la chiffrer — comme son ROI et son coût. Si le sujet arrive dans votre comité RSE ou chez vos clients, parlons-en : c’est une question qui mérite des chiffres, pas des postures.

Note méthodologique : les chiffres par tâche longue (30k-800k tokens) sont des extrapolations à ~0,4 Wh/1 000 tokens, fourchette haute des estimations académiques — Anthropic et OpenAI ne publient pas de mesures officielles par requête.

Footnotes

  1. Google Cloud, Measuring the environmental impact of AI inference (août 2025) et l’étude complète Measuring the environmental impact of delivering AI at Google scale (arXiv:2508.15734) : prompt texte médian Gemini = 0,24 Wh, 0,03 g CO₂e, 0,26 mL d’eau ; énergie par prompt divisée par 33 et émissions par 44 entre mai 2024 et mai 2025. 2

  2. Mistral AI, Our contribution to a global environmental standard for AI (juillet 2025) : première analyse de cycle de vie complète d’un LLM (Mistral Large 2), menée avec Carbone 4 et l’ADEME — 1,14 g CO₂e et 45 mL d’eau par réponse de 400 tokens, cycle de vie complet inclus. 2 3

  3. Epoch AI, How much energy does ChatGPT use? (février 2025) : ~0,3 Wh pour une requête GPT-4o typique, soit 10 fois moins que l’estimation de 3 Wh couramment citée depuis 2023. 2

  4. Sam Altman, The Gentle Singularity (juin 2025) : 0,34 Wh et 0,000085 gallon d’eau (~0,32 mL) par requête ChatGPT moyenne.

  5. RTE, Bilan électrique 2024 : intensité carbone de la production française de 21,7 g CO₂eq/kWh (la plus basse de son histoire), ~95 % de production bas-carbone, 101,3 TWh d’exportations brutes et solde exportateur net record de +89 TWh. 2 3

  6. Ember, Global Electricity Review 2025 (données 2024) : intensité carbone de la production électrique — États-Unis 384 g CO₂/kWh, Chine 560 g, moyenne mondiale 473 g. 2 3

  7. AIE, Energy and AI (avril 2025) : 415 TWh consommés par les datacenters en 2024 (~1,5 % de l’électricité mondiale), projection de ~945 TWh en 2030 dans le scénario de base, l’IA étant le principal moteur de la croissance. 2

  8. Franceinfo, L’intelligence artificielle est-elle une menace pour notre alimentation en électricité ? : 109 milliards d’euros d’investissements privés annoncés au Sommet pour l’action sur l’IA (Paris, février 2025), 35 sites “clés en main” proposés par l’État, citation “plug, baby, plug”.

  9. DeepSeek-AI, DeepSeek-V3 Technical Report (décembre 2024) : entraînement complet en ~2,79 millions d’heures de GPU H800 (puces bridées pour l’export), soit un coût de calcul déclaré d’environ 5,6 M$ — contre des budgets estimés à plus de 100 M$ pour les modèles frontière américains de génération comparable.

  10. Satya Nadella, post sur X du 27 janvier 2025, le jour de la panique boursière DeepSeek ; voir aussi Fortune.

Baptiste Moulard

Baptiste Moulard

Co-fondateur Nefia

Expert métier pour entreprises B2B : experts-comptables, bureaux d'études, avocats, finance, ESN, marketing.

Partager :
Passez à l'action

Envie d'appliquer ces conseils à votre entreprise ?

Discutons de votre projet IA lors d'un audit gratuit de 30 minutes.