“L’IA assèche les nappes phréatiques.” “Une requête ChatGPT consomme un demi-litre d’eau.” “Les datacenters vont engloutir l’électricité mondiale.”
Vous avez lu ces titres. Vos équipes aussi. Et certaines hésitent désormais à utiliser les outils que vous venez de déployer, par scrupule écologique sincère.
Le sujet mérite mieux que des slogans — dans les deux sens. L’empreinte de l’IA est un vrai sujet à l’échelle de l’infrastructure mondiale. Et en même temps, à l’échelle de votre usage, elle est presque toujours négligeable face à vos autres postes d’émissions. Les deux affirmations sont vraies simultanément. Cet article pose les chiffres — sourcés, notes en bas de page — pour qu’on puisse en parler sérieusement.
Ce qu’on sait vraiment (et ce qu’on ne sait pas)
Premier point d’honnêteté : OpenAI et Anthropic ne publient pas de mesures par requête pour GPT-5 ou Claude Opus. Les seuls chiffres officiels et mesurés viennent de deux acteurs :
- Google (août 2025, étude méthodologique complète) : un prompt texte médian sur Gemini consomme 0,24 Wh d’électricité, émet 0,03 g de CO₂e et évapore 0,26 mL d’eau dans le datacenter. Soit l’équivalent de 9 secondes de télévision et 5 gouttes d’eau.1
- Mistral (juillet 2025, première analyse de cycle de vie complète d’un LLM, réalisée avec le cabinet Carbone 4 et l’ADEME) : une réponse de 400 tokens sur Le Chat (Mistral Large 2) représente 1,14 g de CO₂e et 45 mL d’eau — en incluant l’entraînement du modèle, la fabrication du matériel et un périmètre eau beaucoup plus large.2
L’écart entre les deux (×38 sur le CO₂, ×170 sur l’eau) ne signifie pas que l’un ment : ils ne mesurent pas le même périmètre. Google mesure l’inférence et son datacenter ; Mistral inclut tout le cycle de vie. Côté estimations indépendantes, Epoch AI évalue une requête GPT-4o typique à ~0,3 Wh3, et Sam Altman a avancé 0,34 Wh et 0,32 mL d’eau par requête ChatGPT moyenne4.
Retenez la fourchette honnête pour une requête conversationnelle standard : 0,2 à 1 Wh, 0,03 à 1 g de CO₂e, et de quelques gouttes à quelques centilitres d’eau selon le périmètre retenu. Le chiffre de “50 cL d’eau par requête” qui circule correspond à des cas extrêmes ou à des périmètres très larges, pas à une moyenne.
Une nuance importante : ces chiffres médians concernent des petites requêtes. Dès qu’on travaille avec de gros contextes — et c’est tout l’intérêt de l’IA en entreprise — la consommation change d’échelle. C’est ce qu’on va chiffrer.
Votre usage, votre empreinte : 4 profils chiffrés
Les estimations ci-dessous s’appuient sur les travaux académiques récents (~0,4 Wh pour 1 000 tokens traités sur un grand modèle, davantage pour les tokens générés que pour les tokens lus). Ce sont des ordres de grandeur, volontairement en fourchette haute. Le CO₂ dépend du mix électrique : 21,7 g CO₂/kWh en France (record historique 20245) contre ~473 g en moyenne mondiale6 — on donne les deux.
Profil 1 — Usage personnel : la question du soir
“Donne-moi une recette avec ce qui reste dans mon frigo.”
| Par requête | |
|---|---|
| Électricité | ~0,3 Wh |
| CO₂e | 0,03 à 0,15 g |
| Eau | < 1 mL (datacenter) |
C’est l’équivalent de quelques secondes de télévision. Mille requêtes de ce type émettent moins qu’un kilomètre en voiture. À cette échelle, le débat individuel “ai-je le droit moral de poser cette question à ChatGPT ?” n’a pas de base physique.
Profil 2 — Pro débutant : un document de 20 pages
Vous téléchargez un contrat ou un rapport de 20 pages (~15 000 tokens) dans Claude ou ChatGPT et posez cinq questions dessus.
| Par session | |
|---|---|
| Électricité | 10 à 20 Wh |
| CO₂e | ~0,3 g (France) à 8 g (mix mondial) |
| Eau | 10 à 40 mL |
L’équivalent de 100 à 150 mètres en voiture thermique. Si cette session vous évite d’imprimer le document ou un aller-retour de relecture, le bilan net est probablement positif.
Profil 3 — Pro intermédiaire : 20 requêtes par jour
L’usage quotidien typique d’un collaborateur équipé : mails, synthèses, reformulations, quelques documents.
| Par jour | Par an (220 j ouvrés) | |
|---|---|---|
| Électricité | 15 à 30 Wh | 4 à 7 kWh |
| CO₂e | — | 0,1 kg (France) à 3 kg (mix mondial) |
| Eau | 20 à 100 mL | 5 à 20 L |
Une année complète de cet usage émet moins que 20 km en voiture. Pour situer : un seul steak de bœuf représente 5 à 7 kg de CO₂e — davantage que l’année entière d’IA de ce collaborateur.
Profil 4 — Pro expert : agents et gros contextes
C’est notre cas chez Nefia, et celui de nos clients les plus avancés : des agents IA qui chargent un contexte métier complet (base de connaissance, CRM, historique) avant de travailler. Là, on ne parle plus de “requêtes” mais de tâches, et les volumes de tokens explosent.
| Tâche | Tokens traités | Électricité | CO₂e (France / monde) |
|---|---|---|---|
| Petite (rédiger un compte rendu avec contexte) | 30-50k | 15 à 40 Wh | ~0,5 g / ~15 g |
| Moyenne (analyse multi-documents, génération d’un livrable) | 100-200k | 50 à 150 Wh | ~2 g / ~60 g |
| Importante (audit complet, refonte, agent longue durée) | ~800k | 300 à 800 Wh | ~12 g / ~300 g |
Une journée chargée d’expert — deux grosses tâches, quelques moyennes — pèse 1 à 2 kWh. Sur une année, environ 300 kWh : la consommation annuelle d’un réfrigérateur.
En carbone, cette année d’usage intensif représente environ 7 kg de CO₂e si l’inférence tourne en France, 100 à 180 kg sur le mix mondial moyen. C’est le profil le plus lourd qui existe aujourd’hui — et il faut le mettre en face des bons comparateurs.
À vous de jouer : positionnez le curseur sur la taille de votre tâche, choisissez où tourne l’inférence, et regardez ce que ça donne.
La comparaison qui remet les ordres de grandeur en place
| Poste | CO₂e |
|---|---|
| 1 an d’usage IA intermédiaire (20 req/jour) | 0,1 à 3 kg |
| 1 an d’usage IA expert intensif (mix mondial) | 100 à 180 kg |
| 1 aller-retour Paris–New York (par passager) | ~1 800 kg |
| 1 voiture thermique, usage moyen français (12 000 km) | ~2 400 kg |
| Empreinte annuelle moyenne d’un Français | ~9 000 kg |
Le même tableau, en image — et c’est en passant sur l’échelle réelle qu’on comprend le sujet :
Lecture : l’usage IA le plus intensif imaginable représente moins de 10 % d’un seul vol transatlantique, et environ 5 % de la voiture du même collaborateur. Hébergé en France, il tombe sous 0,5 %.
Autrement dit : si votre politique RSE interdit l’IA mais rembourse les vols intérieurs et les déplacements en voiture individuelle, elle optimise le mauvais poste — avec un zèle inversement proportionnel à l’impact.
Impact utilisateur vs impact sociétal : ne pas confondre les deux étages
Tout ce qui précède raisonne par requête et par utilisateur. À cette échelle, le verdict est sans appel : l’impact est marginal. Mais c’est précisément là que le débat public déraille — on répond à une question d’infrastructure avec des arguments de comportement individuel, et inversement.
À l’échelle sociétale, les chiffres changent de nature :
- Les datacenters ont consommé environ 415 TWh en 2024, soit 1,5 % de l’électricité mondiale, et l’AIE projette un doublement à ~945 TWh en 2030 — l’équivalent de la consommation électrique du Japon. L’IA est le principal moteur de cette croissance.7
- L’eau est un vrai sujet, mais local : un datacenter implanté en zone de stress hydrique (Arizona, certaines régions d’Espagne ou du Chili) crée un conflit d’usage réel pour les habitants, même si “votre” requête n’y est pour rien individuellement. La variable décisive n’est pas le volume de prompts, c’est le choix d’implantation et la technologie de refroidissement.
- L’entraînement des modèles et la fabrication du matériel (GPU, serveurs, bâtiments) pèsent lourd — c’est ce que l’ACV de Mistral rend visible2 — mais ils s’amortissent sur des milliards de requêtes.
La conséquence pratique : culpabiliser les utilisateurs est inefficace, et dédouaner les infrastructures est malhonnête. Les bons leviers ne sont pas au même étage. L’utilisateur optimise son usage (bon modèle, bon contexte — on y revient). Les questions qui comptent vraiment — où s’implantent les datacenters, avec quelle électricité, quel refroidissement, quelle transparence des fournisseurs — se jouent au niveau des opérateurs, des États et des régulateurs. C’est un débat de politique énergétique et d’aménagement, pas de morale individuelle.
Et sur ce débat-là, la France a une carte exceptionnelle à jouer.
La France, terre d’accueil naturelle des datacenters
Trois faits, tous issus du bilan électrique 2024 de RTE5 :
- L’électricité française est la plus décarbonée des grandes économies : 21,7 g CO₂/kWh en 2024, record historique, 95 % de production bas-carbone — grâce au nucléaire (~65 % de la production) et à l’hydroélectricité (~13 %).
- La France produit plus qu’elle ne consomme, massivement : 101,3 TWh exportés en 2024, solde net record de +89 TWh vers ses voisins européens. Autrement dit, la France dispose déjà d’un excédent d’électricité décarbonée supérieur à la consommation actuelle de tous les datacenters d’Europe.
- Cette électricité est pilotable (nucléaire + hydraulique), ce qui correspond exactement au besoin d’un datacenter : une charge stable, 24h/24.
La même tâche IA exécutée dans un datacenter français émet plus de 20 fois moins de CO₂ que sur le mix mondial moyen, et près de 26 fois moins qu’en Chine. C’est ce qui explique l’offensive lancée au Sommet pour l’action sur l’IA de Paris en février 2025 : 109 milliards d’euros d’investissements privés annoncés pour des infrastructures IA en France, 35 sites “clés en main” proposés par l’État à proximité du réseau électrique — et la formule restée célèbre d’Emmanuel Macron aux industriels : “plug, baby, plug”.8
Soyons complets, parce que c’est un article sur l’honnêteté des chiffres : accueillir des datacenters n’est pas gratuit. Foncier, artificialisation, raccordements, besoins en eau de refroidissement selon la technologie choisie, tension locale sur certains territoires — ces débats existent et sont légitimes. Mais d’un point de vue climatique global, chaque datacenter construit en France plutôt qu’en Virginie ou au Shandong est une émission divisée par 20. Si la demande mondiale est là de toute façon — et elle l’est — autant qu’elle s’installe sur l’électricité la plus propre disponible.
La courbe d’expérience : l’énergie par requête s’effondre
Deuxième dynamique que le débat public intègre mal : l’efficacité énergétique de l’IA progresse à une vitesse inédite. C’est une courbe d’expérience classique — chaque génération de matériel, de modèle et de logiciel d’inférence fait chuter le coût (énergétique et financier) de la requête :
- Google a mesuré une division par 33 de l’énergie de son prompt médian — et par 44 des émissions — en douze mois (mai 2024 → mai 2025), à qualité de réponse supérieure.1
- Les estimations académiques pour une requête GPT-4o (~0,3 Wh) sont dix fois plus basses que les chiffres qui circulaient encore en 2023 (~3 Wh), en partie parce que les premières estimations étaient grossières, en partie parce que les modèles et les puces se sont réellement améliorés.3
Visualisée, cette chute donne ceci :
Mais cette courbe d’expérience n’est pas la même partout. Trois trajectoires se dessinent :
| 🇺🇸 États-Unis | 🇨🇳 Chine | 🇫🇷 France / Europe | |
|---|---|---|---|
| Stratégie | Frontière absolue : les plus gros modèles, les plus gros datacenters (projet Stargate : 500 Md$ annoncés) | Optimisation sous contrainte : l’embargo sur les puces avancées force l’efficience | Modèles compacts, transparence, inférence décarbonée |
| Efficience | Forte en valeur absolue, mais consommation totale maximale | Remarquable par modèle : DeepSeek-V3 entraîné en ~2,8 M d’heures de GPU bridés, une fraction du coût des modèles frontière américains9 | Bonne : modèles plus petits à performance comparable sur la plupart des usages pro |
| Mix électrique | 384 g CO₂/kWh, et des datacenters de plus en plus alimentés au gaz dédié6 | 560 g CO₂/kWh : l’efficience logicielle est en partie annulée par le charbon6 | 21,7 g CO₂/kWh5 |
| Bilan carbone par requête | Moyen | Moyen malgré l’optimisation | Le meilleur des trois |
L’ironie de ce tableau : la Chine a les modèles parmi les plus optimisés au monde (par nécessité), mais les fait tourner sur le réseau le plus carboné. Les États-Unis ont le plus de moyens, mais une logique de force brute. La position française est singulière : Mistral n’a pas les plus gros modèles, mais combine des modèles efficients, la seule ACV complète publiée du secteur2, un hébergement européen compatible RGPD, et le réseau électrique le plus propre. Pour une entreprise française dont les usages sont des tâches métier (et non de la recherche de frontière), c’est une combinaison difficile à battre — on l’avait déjà noté sous l’angle souveraineté des données.
Courbe d’expérience vs paradoxe de Jevons : pourquoi la consommation totale montera quand même
Si l’énergie par requête est divisée par 33 en un an, le problème est réglé ? Non — et c’est le point le plus important de cet article.
En 1865, l’économiste William Stanley Jevons observait que les machines à vapeur plus efficaces n’avaient pas réduit la consommation de charbon de l’Angleterre : elles l’avaient explosée, parce que l’efficacité rendait la vapeur rentable pour mille nouveaux usages. C’est le paradoxe de Jevons, ou effet rebond.
L’IA est en train d’en livrer l’illustration la plus pure de l’histoire. Quand DeepSeek a démontré en janvier 2025 qu’on pouvait entraîner un modèle de pointe pour une fraction du coût supposé, les marchés ont paniqué sur les valeurs de l’IA — et Satya Nadella, CEO de Microsoft, a répondu en une phrase : “Jevons paradox strikes again! As AI gets more efficient and accessible, we will see its use skyrocket, turning it into a commodity we just can’t get enough of.”10 Chaque division du coût par requête multiplie le nombre de requêtes : c’est déjà ce qu’on observe, et les projections de l’AIE (945 TWh en 2030) intègrent déjà les gains d’efficience.7
Il faut donc dire les choses clairement : la croissance de la consommation totale de l’IA est inéluctable. Pas parce que la technologie serait incontrôlable, mais parce qu’aucun acteur ne peut se permettre de s’arrêter :
- Géopolitique et militaire : la course entre Washington et Pékin a une dimension de défense assumée. Aucune des deux puissances ne ralentira pour des raisons climatiques.
- Compétitivité économique : une entreprise — ou un pays — qui renonce à l’IA pendant que ses concurrents s’équipent transfère simplement la consommation (et la valeur ajoutée) chez eux. L’abstinence unilatérale ne réduit pas l’empreinte mondiale d’un watt ; elle déplace les gains de productivité.
La vraie question n’est donc pas “faut-il y aller ?” — personne n’a ce choix — mais “qui maîtrise qui ?”. Subir l’IA des autres : modèles américains ou chinois, données exportées, inférence sur des réseaux carbonés, dépendance technologique complète. Ou la maîtriser : et pour une entreprise française, la voie cohérente existe déjà — des modèles européens quand l’usage le permet (Mistral en tête), une inférence localisée sur l’électricité décarbonée française, et des usages pilotés plutôt que subis. C’est le seul scénario où souveraineté, compétitivité et climat pointent dans la même direction.
Le lien avec votre facture : l’économie suit l’énergie
Il y a une bonne nouvelle cachée dans le modèle économique de l’IA : le prix que vous payez est corrélé au calcul consommé, donc à l’énergie.
En forfait (ChatGPT Plus, Claude Pro à ~20 €/mois, formules Max à 100-200 €) : le signal prix est masqué, mais les limites d’usage plafonnent de fait la consommation. Un collaborateur en forfait à 20 € ne peut physiquement pas devenir un poste d’émission significatif.
En API (paiement au token) : chaque token traité est facturé. Votre facture API est donc un proxy direct de votre empreinte. Concrètement :
- Une tâche qui recharge inutilement 200 pages de contexte à chaque appel coûte plus cher et consomme plus. L’optimiser (mise en cache du contexte, contexte propre) réduit les deux d’un même geste.
- Choisir un petit modèle pour une tâche simple (tri, extraction, classification) plutôt qu’un modèle frontière divise le coût — et l’énergie — par 10 à 30.
- Un livrable généré une fois et réutilisé cinquante fois bat cinquante régénérations.
C’est un cas rare où l’incitation économique et l’incitation écologique pointent exactement dans la même direction. Une équipe qui pilote sa consommation de tokens — ce qu’on recommande de toute façon pour maîtriser le coût de l’IA — pilote son empreinte sans effort supplémentaire.
Ce qu’on recommande concrètement
- Ne culpabilisez pas les petits usages. Une question à ChatGPT pèse quelques secondes de télévision. L’auto-censure sur ce terrain est de l’énergie morale mal investie.
- Le bon modèle pour la bonne tâche. C’est le levier n°1, à la fois économique et environnemental : réservez les modèles frontière aux tâches qui le justifient.
- Soignez vos contextes. Pas de re-upload systématique du même document, du caching sur les workflows répétitifs, des bases de connaissance propres. Moins de tokens = moins d’euros = moins de watts.
- Privilégiez l’inférence européenne quand c’est possible. Mix à 21,7 g CO₂/kWh, souveraineté, latence : trois bénéfices pour un choix.
- Mesurez. Suivez votre consommation de tokens comme vous suivez vos frais de déplacement. Le jour où une partie prenante vous interroge sur votre usage IA, vous répondez avec des chiffres — comme cet article — au lieu de promesses.
- Gardez les ordres de grandeur en tête dans vos arbitrages RSE. Un seul aller-retour en avion évité compense des années d’usage IA de toute une équipe. Optimisez dans cet ordre.
L’empreinte de votre usage IA, on sait la chiffrer — comme son ROI et son coût. Si le sujet arrive dans votre comité RSE ou chez vos clients, parlons-en : c’est une question qui mérite des chiffres, pas des postures.
Note méthodologique : les chiffres par tâche longue (30k-800k tokens) sont des extrapolations à ~0,4 Wh/1 000 tokens, fourchette haute des estimations académiques — Anthropic et OpenAI ne publient pas de mesures officielles par requête.
Footnotes
-
Google Cloud, Measuring the environmental impact of AI inference (août 2025) et l’étude complète Measuring the environmental impact of delivering AI at Google scale (arXiv:2508.15734) : prompt texte médian Gemini = 0,24 Wh, 0,03 g CO₂e, 0,26 mL d’eau ; énergie par prompt divisée par 33 et émissions par 44 entre mai 2024 et mai 2025. ↩ ↩2
-
Mistral AI, Our contribution to a global environmental standard for AI (juillet 2025) : première analyse de cycle de vie complète d’un LLM (Mistral Large 2), menée avec Carbone 4 et l’ADEME — 1,14 g CO₂e et 45 mL d’eau par réponse de 400 tokens, cycle de vie complet inclus. ↩ ↩2 ↩3
-
Epoch AI, How much energy does ChatGPT use? (février 2025) : ~0,3 Wh pour une requête GPT-4o typique, soit 10 fois moins que l’estimation de 3 Wh couramment citée depuis 2023. ↩ ↩2
-
Sam Altman, The Gentle Singularity (juin 2025) : 0,34 Wh et 0,000085 gallon d’eau (~0,32 mL) par requête ChatGPT moyenne. ↩
-
RTE, Bilan électrique 2024 : intensité carbone de la production française de 21,7 g CO₂eq/kWh (la plus basse de son histoire), ~95 % de production bas-carbone, 101,3 TWh d’exportations brutes et solde exportateur net record de +89 TWh. ↩ ↩2 ↩3
-
Ember, Global Electricity Review 2025 (données 2024) : intensité carbone de la production électrique — États-Unis 384 g CO₂/kWh, Chine 560 g, moyenne mondiale 473 g. ↩ ↩2 ↩3
-
AIE, Energy and AI (avril 2025) : 415 TWh consommés par les datacenters en 2024 (~1,5 % de l’électricité mondiale), projection de ~945 TWh en 2030 dans le scénario de base, l’IA étant le principal moteur de la croissance. ↩ ↩2
-
Franceinfo, L’intelligence artificielle est-elle une menace pour notre alimentation en électricité ? : 109 milliards d’euros d’investissements privés annoncés au Sommet pour l’action sur l’IA (Paris, février 2025), 35 sites “clés en main” proposés par l’État, citation “plug, baby, plug”. ↩
-
DeepSeek-AI, DeepSeek-V3 Technical Report (décembre 2024) : entraînement complet en ~2,79 millions d’heures de GPU H800 (puces bridées pour l’export), soit un coût de calcul déclaré d’environ 5,6 M$ — contre des budgets estimés à plus de 100 M$ pour les modèles frontière américains de génération comparable. ↩
-
Satya Nadella, post sur X du 27 janvier 2025, le jour de la panique boursière DeepSeek ; voir aussi Fortune. ↩