Principes liés à la qualité des données

Principes liés à la qualité des données

Cet article vise à discuter des principes autour de la qualité des données.

Il est recommandé de lire Introduction à l'incertitude au préalable.

ISO 14064-3 proposent des lignes directrices pour la vérification et la validation des déclarations des gaz à effet de serre; ce module sur la qualité des données vise à couvrir ce sujet.

Contexte

Une donnée de qualité peut s'évaluer à travers les critères suivants : 
  1. précision
  2. exhaustivité : Est-ce que l'utilisateur a bien pris en compte tous les flux importants de l'organisation ?
  3. homogénéité : Est-ce que la manière de capturer les données est identiques d'une division à une autre ?
  4. fiabilité : Est-ce que les données sont récentes, et est-ce qu'elles peuvent se mettre à jour facilement ?
  5. actualité : Est-ce que les données sont récentes, et est-ce qu'elles peuvent se mettre à jour facilement ?
La méthodologie Bilan Carbone (voir Étapes d'un Bilan Carbone) adresse en partie ces critères, notamment sur l'aspect exhaustivité. 

À travers la collecte d'information venant directement du système d'information, Budget Our Planet permet d'avoir des jeux de données actuelles, fiables, et homogènes.

Le dernier critère concerne la précision des données. Ceci est un sujet particulièrement spécifique au bilan carbone et aux techniques d'analyse de cycle de vie de manière plus générale, puisque ces méthodologies emploient des Facteurs d'émissions, données issues d'études statistiques, et qui ont un certain degré d'incertitude.

Budget Our Planet a développé un module Qualité, particulièrement dédié au traitement des données incertaines.

Matrice de qualité

Une estimation d'impact peut être notable sur deux critères : 
  1. la valeur de l'impact même. Plus cet impact est important, plus il va devoir être maitrisé dans les futurs plans d'action. D'un autre coté, un impact très faible sera traité de manière marginale dans les futurs plans d'action. 
  2. l'incertitude de l'impact. Plus l'incertitude est grande, plus le risque de sous-évaluer un impact est important.
Nous proposons ainsi une matrice de qualité.


Impact Faible
Impact Fort
Peu Précis
Le facteur d'émission est peu précis avec un impact faible. Nous pourrions travailler la qualité des données, mais cela aura un faible impact sur l'impact global.

Vigilance en terme de Qualité
Le facteur d'émission est peu précis avec un impact potentiellement fort. Un travail complémentaire est nécessaire pour diminuer le degré d'incertitude.

Cas à traiter en terme de Qualité
Précis
Le facteur d'émission est précis et l'impact est faible. Un plan d'action pourrait être construit, mais non prioritaire.

OK en terme de Qualité
Le facteur d'émission est précis et l'impact est fort. C'est sur ce type d'impact qu'il faut traiter dans le plan d'action.

OK en terme de Qualité

Chaque évaluation peut être classée dans un de ces quatre scénarios.

Classification

Précis vs Peu Précis

La classification se fait ici de manière absolue. Nous considérons qu'une source de données imprécis à 40% est le point médian. Un impact ayant une incertitude à plus de 40% sera considéré comme "peu précis". Un impact ayant une incertitude à moins de 40% sera considéré comme "précis".

Impact Faible vs. Impact Fort

La valeur de l'impact est somme toute relative, et varie d'une organisation à une autre. Une large organisation ayant des commandes d'acier par milliers de tonnes n'a pas le même impact, même au niveau de ces transactions et commandes quotidiennes qu'une petite société de service. 

Par conséquent, la classification sur cet axe se base sur la valeur minimale (CO2eqMin) et la valeur maximale (CO2eqMax) de l'impact calculé pour l'ensemble des évaluations dans le périmètre actuel de recherche.
  1. Si la valeur de l'impact est supérieur à (CO2eqMax - CO2eqMin) / 2, l'évaluation est considérée comme ayant un impact fort.
  2. Si la valeur de l'impact est inférieure à (CO2eqMax - CO2eqMin) / 2, l'évaluation est considérée comme ayant un impact faible.

    • Related Articles

    • Source de données : Prix des Carburants

       Le site gouvernemental des prix des carburants met à disposition de manière libre et gratuite (Open data) les données relatives aux prix des carburants. Le prix est disponible par point de vente, par type de carburant acheté, et par jour ouvré. Un ...
    • Introduction à l'incertitude

      Évaluer l'impact lié à un flux d'activité consiste globalement à décrire le flux physique sous-jacent et à identifier le facteur d'émission. La mesure de ce flux physique, ainsi que le facteur d'émission sont tous les deux liés à un degré ...
    • Source de données externes

      Les évaluations peuvent être enrichies avec des données externes. Ces données externes peuvent venir des bases de données standardisées, des abaques d'ingénierie, ou d'API tierces. Cet article vise à lister les données tierces qui sont utilisées par ...
    • Données de démonstration

      Budget Our Planet permet d'explorer les fonctionnalités à travers plusieurs jeux de démo : Light & Co Light & Co - Données trimestrielle Ferma Activation des données de démo Ces jeux de démo peuvent être créés lorsque vous vous inscrivez pour la ...
    • Modèle de données

      Chaque type d'évaluations représente un modèle de données qui lui est propre. Un modèle de données consiste à une collection de propriétés. Chaque propriété possède : un nom usuel (soit en anglais, soit en français en fonction de la langue de ...