Les différentes facettes de la qualité de la donnée
La qualité de la donnée est un concept très vaste qui regroupe des notions différentes de contrôles qui peuvent se faire à la fois sur la donnée et les jeux de données.
La qualité, synonyme de conformité
La qualité de la donnée peut se comprendre comme un contrôle de conformité vis-à-vis :
D’un standard, d’une norme
D’un format de fichier
D’un attribut tel que défini dans une norme / un standard
Elle peut répondre à des questions comme :
Mon fichier est-il conforme aux attendus d’une norme / d’un standard ?
Mon fichier est-il conforme au format attendu par une norme / une standard pour l'échange d’information ?
Mon fichier contient-il les attributs obligatoires définis par une norme / un standard ?
De tels contrôles de conformité peuvent être réalisés sur :
La donnée elle-même (ex. les attributs “order” sont-ils des entiers positifs ?)
Un fichier (ex. mon fichier est-il un XML bien formé ?)
Le jeu de données (ex. mon jeu de données contient-il l’ensemble des fichiers obligatoires ?)
La qualité, synonyme de contrôle qualité
La qualité de la donnée peut se comprendre comme un contrôle de qualité vis-à-vis :
D’un standard, d’une norme, d’un profile de norme
De règles ou d’accords locaux
Des règles métiers
Elles peut répondre à des questions comme :
Le nom de mon fichier suit-il bien les règles du profil local ?
Le contenu de mon fichier correspond-il aux attendus locaux ?
Le contenu de mon fichier fait-il sens pour la publication d’une offre de transport public ?
De tels contrôles de qualité peuvent être réalisés sur :
La donnée elle-même (ex. les IDs de mes arrêts correspondent-ils aux exigences locales ?)
Le jeu de donnée (ex. mon jeu de données contient-il l’ensemble des fichiers requis par le profil local ?)
Les données historisées (ex. un attribut persistent est-il bien le même dans chacun de mes jeux de données ?)
Les jeux de données historisés (ex. mon jeu de données contient-il toujours les mêmes fichiers obligatoires ?)