Métadonnée
Une métadonnée, ou metadata en anglais, est une donnée qui décrit une autre donnée.
Qu'est-ce qu'une métadonnée ?
Une métadonnée, ou metadata en anglais, est une donnée qui décrit une autre donnée. Elle fournit des informations de contexte sur un fichier, un document, un jeu de données ou une ressource numérique : titre, auteur, date de création, format, taille, mots-clés, licence, couverture géographique ou temporelle, structure, provenance, etc.
En d'autres termes, les métadonnées ne correspondent pas au contenu principal lui-même, mais aux renseignements qui permettent de comprendre ce qu'est ce contenu, d'où il vient, comment il est structuré et comment on peut l'utiliser. Cette logique est souvent résumée par l'expression « des données sur les données ». Elles jouent un rôle essentiel pour rechercher, classer, retrouver, partager, gouverner et réutiliser l'information.
Définition technique de la métadonnée
D'un point de vue technique, une métadonnée peut décrire plusieurs dimensions d'une ressource numérique : titre, description, licence, fréquence de mise à jour, couverture spatiale, temporelle ou encore mots-clés. Dans les systèmes d'information, les métadonnées créent une couche d'intelligibilité au-dessus des données brutes. Elles permettent à des utilisateurs techniques et non techniques de mieux comprendre la signification d'une table, d'une colonne, d'un fichier ou d'un indicateur, notamment dans les dispositifs de catalogue de données, de glossaire métier et de gouvernance de la donnée.
Les grandes familles de métadonnées
Il existe plusieurs grandes familles de métadonnées, chacune répondant à des besoins spécifiques de gestion, d'exploitation et de conservation de l'information. Ces schémas de classification facilitent l'organisation et la taxonomie des ressources numériques dans les systèmes d'information.
| Type | Rôle |
|---|---|
| Métadonnées descriptives | Servent à identifier et retrouver une ressource : titre, auteur, résumé, mots-clés, sujet. Elles améliorent la découvrabilité dans les catalogues et moteurs de recherche. |
| Métadonnées techniques | Décrivent la structure, les formats, les colonnes, les types de données ou les relations. Elles documentent les aspects techniques nécessaires à l'exploitation et à l'interopérabilité. |
| Métadonnées administratives | Documentent les droits, la licence, la gestion, la conservation et les conditions d'accès. Elles encadrent l'usage juridique et organisationnel des ressources. |
| Métadonnées de préservation | Aident à garantir l'accessibilité d'une ressource dans le temps en documentant son cycle de vie, ses migrations de format et son archivage à long terme. |
Les standards : Dublin Core, normes ISO et données EXIF
Pour garantir l'interopérabilité entre systèmes, plusieurs standards internationaux structurent l'échange de métadonnées. Le Dublin Core définit quinze éléments de base (titre, créateur, sujet, description, date, type, format, identifiant, langue, droits, etc.) pour décrire des ressources de toute nature. Normalisé sous la référence ISO 15836, il est largement utilisé dans les bibliothèques, les archives et les portails de données.
Dans le domaine géospatial, la norme ISO 19115 définit le schéma requis pour décrire des informations géographiques au moyen de métadonnées. Elle précise les éléments permettant la découverte, l'évaluation et l'utilisation des données géographiques, notamment dans les infrastructures de données territoriales françaises.
Pour les photos et images numériques, les données EXIF (Exchangeable Image File Format) constituent un standard technique. Intégrées directement dans les fichiers JPEG et TIFF, elles enregistrent automatiquement les réglages de prise de vue, les informations sur l'appareil, la date et l'heure, ainsi que les coordonnées GPS lorsque la géolocalisation est activée.
Enjeux et impacts des métadonnées pour les collectivités
Le premier enjeu des métadonnées est la découvrabilité de l'information. Dans les systèmes de gestion documentaire des collectivités, les métadonnées permettent de retrouver rapidement un jeu de données pertinent, de comprendre sa portée et d'évaluer s'il répond à un besoin précis. Elles facilitent l'indexation par les moteurs de recherche et améliorent la visibilité des pages web des portails open data territoriaux. Sans métadonnées bien renseignées, les agents, les élus et les réutilisateurs peinent à identifier les ressources utiles parmi les centaines de jeux publiés.
Le deuxième enjeu est celui de la gouvernance. Les métadonnées structurent les catalogues, les glossaires et les dictionnaires de données qui soutiennent la qualité de l'information. Elles facilitent la compréhension partagée entre métiers et équipes techniques, la traçabilité, l'analyse d'impact, la documentation et la conformité. Une gestion efficace des métadonnées améliore ainsi l'accessibilité, la fiabilité et la réutilisation des données tout au long de leur cycle de vie, de leur production à leur archivage.
Le troisième enjeu est juridique et réglementaire. Certaines métadonnées peuvent elles-mêmes constituer des données personnelles lorsqu'elles permettent d'identifier directement ou indirectement une personne physique. Les autorités de protection des données rappellent que des identifiants techniques, des données de connexion, une adresse IP ou le croisement de plusieurs informations peuvent entrer dans le champ du RGPD. Cela signifie qu'une métadonnée n'est pas automatiquement neutre du point de vue de la protection des données.
Enfin, les métadonnées ont un impact direct sur la réutilisation. Dans l'open data territorial, la présence d'une licence, d'une description claire, d'une couverture spatiale et temporelle ou d'indications sur la mise à jour conditionne la capacité des réutilisateurs à exploiter correctement les données. C'est pourquoi certains cadres de publication imposent des métadonnées obligatoires, notamment pour les données de forte valeur.
Cas d'usage des métadonnées : exemples concrets
Dans une collectivité territoriale, les métadonnées servent à décrire les jeux de données publiés en open data : intitulé du jeu, producteur, fréquence de mise à jour, couverture géographique, période couverte, licence de réutilisation et documentation associée. La plateforme nationale data.gouv.fr permet ainsi aux collectivités de publier leurs données avec les métadonnées requises, facilitant la découverte et la réutilisation par les citoyens, les chercheurs et les entreprises. La Ville d'Antibes, par exemple, valorise plus de 150 jeux de données via ce portail sans infrastructure propre.
Dans les bases de données métier et les systèmes documentaires, les métadonnées décrivent la structure technique des tables, colonnes, types de données, relations et règles de gestion. Pour les collectivités et les entreprises, des outils de catalogue de données comme DataGalaxy, Zeenea ou Koumoul permettent de centraliser et documenter ces informations, facilitant ainsi les projets de migration, d'intégration, de business intelligence ou d'intelligence artificielle.
Dans les photos et vidéos produites quotidiennement par les agents territoriaux, une photo d'inspection terrain contient automatiquement la date de prise de vue, le modèle d'appareil, les coordonnées GPS et d'autres informations techniques. De même, les vidéos de conseils municipaux ou d'événements publics comportent des métadonnées décrivant leur durée, leur format, leur auteur ou leur date de création. Ces éléments facilitent l'archivage et la recherche, mais peuvent aussi révéler des informations personnelles lorsqu'ils sont diffusés sans précaution.
Enfin, dans les fichiers administratifs courants, les métadonnées renseignent l'auteur d'un document, sa date de création, son format, sa taille ou les droits d'accès associés. Ces informations aident à organiser les contenus, mais doivent être gérées avec vigilance dans un contexte de transparence et de protection des données personnelles.