Aller au contenu

Exports des statistiques de l'audit

Pour des conseils sur l'exploitation de ces métriques, n'hésitez pas à contacter le support.

Télécharger le fichier .xlsx

Pour réaliser l'export des données et des services :

  • Se rendre sur la page de la requête à exporter.
  • Une fois qu'elle est terminée, un bouton "Exporter" sera disponible.
  • Cliquer alors sur "Exporter les statistiques"
Exporter les données

Contenu du fichier .xlsx

Audit de données (fichiers ou bases de données)

Le fichier .xlsx est composé de plusieurs onglets :

  • Global : informations globales (nombre de données détectées, de données en erreur, de données vides et de données ignorées).
  • Formats : répartition des données détectées entre les différents formats.
  • Geometries (disponible s'il y a des données vectorielles) : répartition des données détectées entre les différents types de géométries (ponctuelle, linéaire...).
  • Schemas (disponible pour les points d'entrée de base de données) : répartition des données détectées entre les différents schémas.
  • Folders (disponible pour les points d'entrée fichier) : répartition des données détectées entre les différents dossiers.
  • Attributes (disponible s'il y a des données vectorielles) : liste des attributs pour détecter la récurrence.
  • Duplicates (disponible si des doublons ont été détectés) : liste des couples de données qui pourraient être des doublons. On distingue deux types de doublon :
    • Le type "structure" pour les données ayant en commun toutes les caractéristiques suivantes :
      • le format,
      • les attributs (données vectorielles uniquement),
      • le nombre d'entités (données vectorielles uniquement),
      • le type de géométrie des entités (données vectorielles uniquement),
      • les bandes (données raster uniquement),
      • le nombre de colonnes (données raster uniquement),
      • le nombre de lignes (données raster uniquement),
      • le système de coordonnées (ou l'absence de système de coordonnées),
      • et l'enveloppe.
    • Le type "name" pour les données ayant le même nom, en plus d'avoir toutes les caractéristiques mentionnée ci-dessus en commun.
  • DatasetsWithDuplicates (disponible si des doublons ont été détectés) : Cet onglet reprend les doublons de type "structure" (voir onglet Duplicates) en les présentant différemment. Le tableau comporte une ligne par donnée, donc une ligne par exemplaire de doublon.

    La colonne duplicateId indique l'identifiant du doublon (tous les exemplaires d'un même doublon auront la même valeur dans cette colonne). La colonne count indique le nombre d'exemplaires du doublon. Les colonnes name, location, format et dataType contiennent des informations relatives à chaque donnée.

Données prises en compte dans chaque onglet

Les 4 onglets suivants couvrent l'intégralité des données détectées par l'Audit, y compris celles qui ont été ignorées ou dont la documentation a échoué :

  • Global
  • Formats
  • Schemas
  • Folders

Les 3 onglets suivants couvrent les données documentées avec succès qui n'ont pas été ignorées ainsi que les données documentées avec succès mais ignorées car non-géographiques :

  • Attributes
  • Duplicates
  • DatasetsWithDuplicates

Pour finir, l'onglet Geometries couvre uniquement les données vectorielles documentées avec succès qui n'ont pas été ignorées.