Une controverse agite le monde des diagnostics de performance énergétique. Une étude publiée par la startup KRNO indiquerait l’existence d’une fraude généralisée dite aux « DPE de complaisance » dont l’impact serait:
19% des biens F injustement reclassés en E, 21 milliards de préjudice potentiel
La Chambre des Diagnostiqueurs Immobiliers a mis en garde contre les résultats de cette étude dans un communiqué de presse, indiquant que la classification des logements en classe d’énergie par le DPE est le résultat d’un procédé technique complexe et que d’autres causes de la fraude peuvent expliquer les résultats obtenus par KRNO.
Cet article présente une méthodologie différente de celle utilisée par KRNO pour l’estimation de la présence et de l’impact des DPE dits « de complaisance » qui prend en compte certains des commentaires de la Chambre des Diagnostiqueurs Immobiliers.
Nous répliquons les résultats obtenus par KRNO et d’autres études postérieures: 3.2% des DPE présenteraient des anomalies statistiques (et jusqu’à 7% des DPE pour certains types de logement). Nous estimons aussi que 17% des biens qui auraient dû être classé F se retrouvent dans la classe E.
Un DPE c’est quoi ?
Un diagnostic de performance énergétique évalue la consommation en énergie primaire d’un logement. La performance énergétique est réduite pour le DPE à l’estimation de deux quantités:
- la consommation d’énergie primaire par le logement (exprimée en kWh/m²/an)
- les émissions de gaz à effet de serre (exprimée en kgCO2/m²/an).
Ces estimations sont transformées en une classe (de A pour les logements les plus économes en énergie à G pour les passoires thermiques).

Exemple d’une étiquette énergie climat pour un logement de classe E. Une consommation de 271 kWh/m²/an résulte en une classe E.
Remarque
La transformation de la consommation d’un logement en note dépend aussi de sa localisation, des ajustements étant réalisés pour certains logements en altitude.
Un DPE de complaisance serait donc un DPE sous estimant de manière relativement bénigne la consommation d’un logement (des différences de quelques kWh/m²/an seulement) de manière à franchir les seuils de classe du DPE.
Études précédentes
Le phénomène mis en évidence par l’étude KRNO a déjà été remarqué et étudié plusieurs fois.
Déjà en 2021, Yassine Abdelouadoud proposait une méthode pour corriger l’impact des pics observés afin d’étendre les résultats des DPE à l’ensemble du parc immobilier français.
Récemment en juin 2024, une note du Conseil d’Analyse Économique consacrée à la fiabilité des DPE estimait que 3.9% des DPE d’avant les réformes de 2021 présentaient des anomalies statistiques.
Enfin, il est intéressant de noter un article scientifique1 qui s’est intéressé à ce phénomène et à l’impact sur le prix de vente des biens immobiliers d’un déclassement DPE. Ainsi, d’après cet article, passer d’une classe C à D, D à E, E à F, F à G résulterait en un prix de vente décoté de 1.9% à 4.5%.
Cet article remarque aussi que certains diagnostiqueurs publieraient plus fréquemment que d’autres des DPE très proches des seuils de classe.
Obtention et filtrage des données
L’ADEME (Agence de la transition énergétique) met à disposition en open-data la liste complète des DPEs (diagnostic de performance énergétique) réalisés depuis Juillet 2021.
Pour mener à bien une analyse poussée, nous avons téléchargé les données sous leur forme la plus complète: une base de donnée PostgreSQL, qui une fois décompressé fait 190GB.
Cette base de données comprend les données détaillées, mais anonymisées, de 12,485,187 DPE réalisés de Juillet 2021 à fin Octobre 2024.
Pour garantir une analyse cohérente des DPE nous allons nous focaliser sur les DPE qui suivent les critères suivants:
- réalisés pour des logements à fonction d’habitation
- dont la consommation est plausible, c’est-à-dire entre 10 et 800 kWh/m²/an2
- réalisés pour des maisons individuelles ou des appartements
- pas ré-édités/remplacés/désactivés
- pas affectés par les ajustements liés à l’altitude et à la zone climatique3
- qui utilisent la méthode “DPE 3CL 2021 méthode logement” (ce qui exclu les DPE réalisés pour les logements neufs)
- de version 2/2.1/2.2/2.3/2.44
- pour lesquels les données des consommations des 5 usages sont présentes et cohérentes5
Cela nous laisse 8,447,244 DPE (67.65% des DPE bruts) répondant à tous ces critères.
Exploration statistique
En représentant le nombre de DPE en fonction de leur consommation en énergie primaire, on observe clairement des effets de pics autour des frontières entre les classes (représentées par les lignes pointillées verticales). L’origine de ces pics est le cœur de la controverse soulevée par l’étude KRNO.

La distribution des émissions de gaz à effet de serre semble présenter aussi des pics juste avant les transitions de classe, mais cet effet semble moins prononcé que pour la consommation en énergie primaire:

Remarque
Les seuils de classe GES (gaz à effet de serre) ayant changé en Juillet 2024, ce graphique ne représente que les DPE réalisés avant ce changement, avec les seuils applicables avant Juillet 2024.
Pour le reste de cette étude, nous allons nous intéresser aux pics visible dans la distribution de la consommation en énergie primaire.
Qu’est-ce-que la consommation en énergie primaire ?
Exprimée en kilowatt-heure par mètre carré par an, la consommation en énergie primaire d’un logement comptabilise l’utilisation en énergie de 5 types de systèmes liés à la performance énergétique du bâtiment:
- le chauffage
- la production d’eau chaude sanitaire
- le refroidissement (climatisation)
- l’éclairage
- les auxilliaires (ventilation, etc.)
Remarque
Les DPE comparent des mesures en énergie primaire afin de prendre en compte les sources d’énergies utilisées.
L’énergie primaire est à comprendre comme l’énergie extraite de l’environement pour la production d’énergie finale.
Par exemple, pour 1kWh d’énergie finale de chauffage produite avec de l’électricité, 2.3kWh d’énergie primaire sont consommés, alors que la même quantité d’énergie finale de chauffage est obtenue avec seulement 1kWH en utilisant la combustion de bois ou de gaz.
Quels types de logements crées des pics ?
Une segmentation de la consommation en énergie primaire selon deux dimensions (période de construction et type de chauffage principal) permet de mieux comprendre les caractéristiques des logements présentant ces pics.

La segmentation par période de construction fait apparaître que les pics aux seuils de classes sont plus prononcés pour les logements les plus anciens.
On remarque aussi une bimodalité de la distribution de la consommation en énergie primaire: les logements construits selon la norme RT2021 (donc après 2021) sont très performants énergétiquements alors qu’à l’inverse, les logements construits avant 2021 ont très rarement une performance énergétique digne d’une classe A ou B6.
Étant donné la sensibilité des outils de modélisation statistiques à une distribution multimodale, il convient de modéliser la distribution en consommation en énergie primaire en tenant compte de la période de construction du logement.
La segmentation par type de chauffage principale nous apporte elle aussi de précieux renseignements:

Il apparait ainsi que les pics aux seuils de classes sont plus prononcés pour certains types de chauffages (électricité et bois) que pour d’autres.
Remarque
Cette segmentation s’est limitée aux types de chauffages présents dans plus de 50,000 DPE et regroupe les différents types de chauffage par bois (bûches, pellets, etc..) en un seul.
Répartition des 5 usages
La consommation en énergie primaire mesurée par le DPE est la somme de la consommation de 5 usages:
- le chauffage
- la production d’eau chaude sanitaire
- le refroidissement (climatisation)
- l’éclairage
- les auxilliaires (ventilation, etc.)
La consommation totale est dominée logiquement par le chauffage, suivi par la production d’eau chaude sanitaire.

Les distributions des deux usages principaux (chauffage et eau chaude sanitaire) ne présentent pas de pics non-naturels:


Seulement 6.65% des DPE contiennent une consommation liée au refroidissement du logement:

La consommation en éclairage par m² est dérivée uniquement par la situation géographique du bien à travers une estimation du nombre d’heures d’éclairage artificiel nécessaires par jour selon le mois et la zone climatique. Cette distribution est donc très reserrée.

Enfin, la distribution de la consommation des systèmes auxiliaires est plus intéressante et présente des pics clairs:

Cependant, cela semble être un artefact de la méthodologie employée car seuls les logements chauffés à l’électricité présentent ces pics alors que les pics au cœur de la controverse soulevée par KRNO sont présents pour d’autres types de chauffage.

Récapitulatif
Voici ce que nous avons apris de cette exploration statistique:
- il y a bien des pics de logements juste avant les seuils de transition de classe énergétique
- ces pics ne sont pas uniforméments répartis selon les caractéristiques des logements: les logements les plus récents semblent épargnés, les logements chauffés à l’électricité et au bois sont les plus affectés.
- aucun des 5 usages qui une fois combinés forment la consommation mesurée par le DPE ne présentent de pics non explicables
Comment corriger ces pics ?
Les pics observés semblent artificiels de part leur présence spécifiquement aux seuils de classe de DPE. On ne peut pas clairement les attribuer à une seule source (comme le chauffage, ou un certain type de logement).
Il semble donc plausible qu’ils soient bien la preuve de DPE de complaisance.
On observe ce phénomène dans d’autres domaines où il existe des seuils artificiels, par exemple la fameuse distribution en cloche des moyennes scolaires perturbées lorsqu’il s’agit de notes du bac:

Approches précédentes
L’approche de KRNO pour la quantifier est critiquable: d’une part le choix d’une loi log normale ne semble pas adapté (le logarithme de la consommation ne suit pas une loi gaussienne) et d’autre part la qualité d’une interpolation par spline cubique dépend énormément des points de référence choisis (qui ne sont d’ailleurs pas publiés).
L’approche présentée par Yassine Abdelouadoud paraît plus robuste: choix d’une loi béta, exclusion des valeurs extrêmes, attention portée à la multimodalité des distributions sous-jacentes.
Ces deux approches cherchent à modéliser la consommation en énergie primaire par le biais de distributions statistiques existantes. Hors il n’y a pas de garantie que la distribution « réelle » suive une telle loi.
Notre approche
Au lieu d’une modélisation par une loi statistique, nous cherchons à reconstituer la consommation en énergie primaire en additionnant les 5 usages qui la compose.
Pour cela nous transformons les données en consommation de chacun des usages en histogrammes (dont les largeurs et le nombre de classes est adaptée à la distribution des données).
Ensuite nous créons des millions de DPE « virtuels » en échantillonant chaque histogramme de manière aléatoire. Enfin, nous regardons la distribution de ces DPE « virtuels » est ensuite comparée à la distribution réelle.
Cela suppose comme hypothèse que la consommation de chacun des 5 usages est indépendente statistiquement des autres. Il est impossible de confirmer cette hypothèse, mais on peut mesurer qu’elles ne sont pas corrélées ce qui conforte la suite du raisonnement statistique.
Voici ce que cette méthode donne pour les maisons construites dans la période 1978-1982 et chauffées au gaz naturel:

On observe à la fois que la distribution reconstituée est très proche des données réelles, et une quasi-absence de pics non-naturels.
L’application de cette méthode à des sous-ensembles de DPE pour lesquels une forte proportion de DPE dits de « complaisance » est révélatrice:

La distribution reconstituée est quasi identique aux données réelles dans ses extrêmes mais différe très fortement des données réelles au niveau des transitions de classe.
En étendant cette méthodologie à tous les logements, on obtient le graphique suivant:

On peut aussi reproduire le graphique des différences entre la distribution attendue et la distribution actuelle présent dans l’étude de KRNO:

Finalement, on peut estimer le nombre de DPE manipulés en comptant le nombre de DPE présents dans ses pics (les zones en rouge dans le graphique).
En étendant cette approche à tous les types de logements, nous obtenons les résultats suivants:
- 0.33% des biens de la classe D sont potentiellement surclassés en C (KRNO estime 0.57%)
- 7.11% des biens de la classe E sont potentiellement surclassés en D (KRNO estime 5.61%)
- 16.64% des biens de la classe D sont potentiellement surclassés en E (KRNO estime 18.81%)
- 6.53% des biens de la classe G sont potentiellement surclassés en F (KRNO estime 6.09%)
Au total, nous estimons que 3.2% des DPE analysés seraient potentiellement des DPE de complaisance. Ces chiffres sont similaires à ceux (3.9%) publiés dans la note du Conseil d’Analyse Économique.
Nous pouvons aussi voir quels types de logements sont les plus susceptibles d’avoir des DPE « de complaisance »:
Type de logement | Construction | Chauffage | % DPE « de complaisance » (estimation) |
---|---|---|---|
appartement | avant 1948 | Électricité | 7.37% |
maison individuelle | avant 1948 | Électricité | 7.21% |
maison individuelle | 1948-1974 | Bois | 7.12% |
maison individuelle | 1975-1977 | Électricité | 7.11% |
appartement | 1948-1974 | Électricité | 6.95% |
maison individuelle | 1948-1974 | Électricité | 6.81% |
maison individuelle | 1978-1982 | Électricité | 6.64% |
maison individuelle | 1983-1988 | Bois | 6.60% |
maison individuelle | 1978-1982 | Bois | 6.59% |
maison individuelle | avant 1948 | Bois | 6.35% |
Et quels sont les moins susceptibles à être manipulés:
Type de logement files/fraude-dpe-complaisance.pdf | Construction | Chauffage | % DPE « de complaisance » (estimation) |
---|---|---|---|
appartement | 2013-2021 | Gaz naturel | 0.17% |
maison individuelle | 2013-2021 | Gaz naturel | 0.17% |
appartement | 2006-2012 | Gaz naturel | 0.45% |
maison individuelle | 2006-2012 | Gaz naturel | 0.46% |
appartement | 1989-2000 | Gaz naturel | 0.61% |
maison individuelle | 2001-2005 | Gaz naturel | 0.65% |
maison individuelle | avant 1948 | Fioul domestique | 0.71% |
maison individuelle | 1989-2000 | Gaz naturel | 0.71% |
appartement | 2006-2012 | Réseau de Chauffage urbain | 0.72% |
appartement | 2013-2021 | Réseau de Chauffage urbain | 0.74% |
Conclusion
Au 1er janvier 2025, les logements classés G ne peuvent plus être mis en location. L’effet attendu des pouvoirs publics est sans doute de forcer la main des propriétaires de passoires thermiques afin qu’ils réalisent les travaux nécessaire pour rendre ces logements décents. Nous pouvons néamoins craindre que cela ne fasse qu’augmenter le recours à ces DPE de complaisance, déjà bien répandus pour ces logements.
Heuresement, il sera possible grâce aux méthodes présentées dans cet article d’estimer si cela est le cas.
Lu, Xinyu, and Christophe Spaenjers. “Energy Labels, House Prices, and Efficiency Misreporting.” House Prices, and Efficiency Misreporting (April 3, 2023) (2023). ↩︎
0.04% des DPE bruts ont une consommation de moins de 10 kWh/m²/an et 0.24% ont une consommation supérieure à 800 kWh/m²/an ↩︎
Exclusion des logements situés à plus de 800m d’altitude ET zone climatique H1b, H1c, H2d. ↩︎
pour de nombreux DPE (13% des DPE bruts), la somme de la consommation des 5 usages réglementaires n’est pas égale à celle indiquée par “conso_5_usages”. ↩︎
1.42% des logements construits avant 2021 ont une consommation équivalente à la classe A, ce chiffre tombe à 0.52% pour les logements construits avant 2001 ↩︎