Les différentes facettes de la qualité de la donnée

Les différentes facettes de la qualité de la donnée

La qualité de la donnée est un concept très vaste qui regroupe des notions différentes de contrôles qui peuvent se faire à la fois sur la donnée et les jeux de données.

La qualité, synonyme de conformité

La qualité de la donnée peut se comprendre comme un contrôle de conformité vis-à-vis :

  • D’un standard, d’une norme

  • D’un format de fichier

  • D’un attribut tel que défini dans une norme / un standard

Elle peut répondre à des questions comme :

  • Mon fichier est-il conforme aux attendus d’une norme / d’un standard ?

  • Mon fichier est-il conforme au format attendu par une norme / une standard pour l'échange d’information ?

  • Mon fichier contient-il les attributs obligatoires définis par une norme / un standard ?

De tels contrôles de conformité peuvent être réalisés sur :

  • La donnée elle-même (ex. les attributs “order” sont-ils des entiers positifs ?)

  • Un fichier (ex. mon fichier est-il un XML bien formé ?)

  • Le jeu de données (ex. mon jeu de données contient-il l’ensemble des fichiers obligatoires ?)

La qualité, synonyme de contrôle qualité

La qualité de la donnée peut se comprendre comme un contrôle de qualité vis-à-vis :

  • D’un standard, d’une norme, d’un profile de norme

  • De règles ou d’accords locaux

  • Des règles métiers

Elles peut répondre à des questions comme :

  • Le nom de mon fichier suit-il bien les règles du profil local ?

  • Le contenu de mon fichier correspond-il aux attendus locaux ?

  • Le contenu de mon fichier fait-il sens pour la publication d’une offre de transport public ?

De tels contrôles de qualité peuvent être réalisés sur :

  • La donnée elle-même (ex. les IDs de mes arrêts correspondent-ils aux exigences locales ?)

  • Le jeu de donnée (ex. mon jeu de données contient-il l’ensemble des fichiers requis par le profil local ?)

  • Les données historisées (ex. un attribut persistent est-il bien le même dans chacun de mes jeux de données ?)

  • Les jeux de données historisés (ex. mon jeu de données contient-il toujours les mêmes fichiers obligatoires ?)