Projet Métadonnées – Dublin Core
Le projet final du cours de Métadonnées est disponible ci-dessous, mais également au format PDF, ici: Projet Metadonnées
Projet Métadonnées – Dublin Core
Partie 1
Proposez une présentation synthétique du Dublin Core en quelques lignes.
En 1995, l’Online Computer Library Center (OCLC) et le National Center for Supercomputing Applications (NCSA) se réunissent à Dublin, dans l’état américain de l’Ohio, pour former un groupe de travail : le Dublin Core Metadata Initiative (DCMI). Ce groupe de travail, qui réunit des professionnels de divers domaines (bibliothéconomie, informatique, muséologie…) réfléchit à l’adoption de standards de métadonnées[1] interopérables pour la description des ressources électroniques. Le but étant, face à la prolifération des documents numériques publiés sur le web, de faciliter leur recherche, leur repérage et leur identification.
C’est donc à l’issue de cette réflexion que naît le Dublin Core. Le DCMI s’est fixé plusieurs objectifs via cette norme : faciliter la création, la gestion et la recherche de ressources, faire en sorte que les éléments de description soient universellement compris en adoptant une terminologie claire et accessible, faciliter l’utilisation du Dublin Core à l’échelle internationale et permettre la « flexibilité » de cette norme pour l’adapter à d’autres besoins ou à de nouveaux types de ressources.
Le Dublin Core est constitué de quinze champs de métadonnées appelés « Eléments », relatifs au contenu, à la version de la ressource décrite et à la propriété intellectuelle. Chaque élément est facultatif et peut être répété.
Présentez en quelques lignes les notions de raffinements et de vocabulaires pour Dublin Core.
Il est possible, pour certains de ces éléments, de préciser leur signification à l’aide de « Raffinements » ou « qualifiants ». Facultatifs, les raffinements sont néanmoins utiles pour restreindre (et non pas étendre) la signification d’un élément. Lorsque l’on utilise ces qualifiants, on parle de « Dublin Core qualifié ».
Les éléments du Dublin Core et leurs raffinements peuvent être représentés de différentes manières : ils peuvent, par exemple, être inclus dans les balises <meta> des pages HTML.
Les valeurs de description associées aux champs de métadonnées peuvent être restituées en langage libre (c’est-à-dire sans faire appel à des vocabulaires ou standards particuliers). Il est cependant préférable d’utiliser des formats ou des vocabulaires officiels pour que ces valeurs puissent être extraites et interprétées correctement et ce, de manière universelle.
Prenons l’exemple de l’élément Date. On peut, librement, faire référence à la date de cette façon : 05/07/07. Pour nous, français, il s’agit bien du 05 juillet 2007 mais pour un anglophone, il s’agira du 07 mai 2007. Il est donc nécessaire de lever toute ambiguïté en utilisant des vocabulaires normalisés, comme le préconise le DCMI (dans le cas de la date, on pourra utiliser le format W3CDTF : AAAA-MM-JJ).
Partie 2
Fournissez pour chaque élément du Dublin Core : une courte définition en quelques mots, un exemple de valeur et lorsque cela est possible, une déclinaison de chaque raffinement (sauf pour les éléments DATE et RELATION pour lesquels il suffira de faire cette déclinaison sur le 1er raffinement et simplement citer les autres raffinements possibles).
Vous utiliserez pour cela un formalisme de type métabalise HTML
<META NAME=”…” CONTENT =”…”> ou
<META NAME=”…” SCHEME=”…” CONTENT=”…”>
Le tableau suivant présente les quinze éléments de description du Dublin Core ainsi que leurs raffinements. Dans le cadre de cette présentation, une ressource a été décrite : il s’agit du livre « Le Seigneur des Anneaux : La Communauté de l’Anneau ».
|
Eléments |
Description |
|
Title |
· Définition : nom ou titre principal de la ressource · Raffinements : - Alternative : abréviation ou traduction du titre · Exemple : <META NAME=”DC.Title” CONTENT =”Le Seigneur des Anneaux, tome 1 : La Communauté de l’Anneau”> <META NAME=”DC.Title.Alternative” CONTENT =”The Lord of the Rings, Part 1 : The Fellowship of the Ring”> |
|
Creator |
· Définition : nom de l’entité responsable de la création du contenu de la ressource (organisation, service, personne…) · Exemple : <META NAME=”DC.Creator” CONTENT =”TOLKIEN, John Ronald Reuel”> |
|
Subject |
· Définition : sujet du contenu de la ressource (transcriptible par des mots-clés, des phrases de résumé ou des codes de classification) · Vocabulaires recommandés : LCSH (en-tête de la Bibliothèque du Congrès), LCC (classification de la Bibliothèque du Congrès), MESH (vocabulaire médical), DDC (Classification décimale de Dewey) ou UDC (Classification décimale universelle) · Exemple : <META NAME=”DC.Subject” CONTENT =”Littérature”> <META NAME=”DC.Subject” SCHEME=”DDC” CONTENT=”800″> |
|
Description |
· Définition : résumé, table des matières ou texte descriptif libre de la ressource · Raffinements : - Table Of Contents : table des matières - Abstract : résumé · Exemple : <META NAME=”DC.Description.Abstract” CONTENT =”Le Tiers Age touche à sa fin, et la Terre du Milieu à son crépuscule. La Compagnie de l’Anneau va donc tâcher de déjouer les projets infernaux de Sauron, force du mal d’autant plus difficile à combattre qu’elle est désincarnée. Qui, des cinq héros, mènera à bien la mission ? Gandalf, grand sage qui seul mesure la portée de la quête ? Aragorn, qui dissimule ses origines princières sous les traits d’un rôdeur taciturne ? Frodon et Sam, qui sont chargés de la phase finale de la mission ou Gollum, créature abjecte qui fut un temps dépositaire de l’anneau ? Mais quel est donc le pouvoir de cet anneau tant convoité ? Quelle est donc la signification de l’énigme qui figure en première page, en manière d’épigraphe ?“> |
|
Publisher |
· Définition : nom de l’entité responsable de la publication de la ressource (organisation, service, personne…) · Exemple : <META NAME=”DC.Publisher” CONTENT =”Gallimard Jeunesse”> |
|
Contributor |
· Définition : nom de l’entité ayant contribué à la création du contenu de la ressource (organisation, service, personne…) · Exemple : <META NAME=”DC.Contributor” CONTENT =”LEDOUX, Francis”> |
|
Date |
· Définition : date associée à un évènement dans le cycle de vie de la ressource (le plus souvent, date de création ou de publication) · Vocabulaires recommandés : W3CDTF (format AAAA-MM-JJ) · Raffinements : - Created : date de création - Valid : date ou période de validité - Available : date ou période de mise à disposition - Issued : date de publication - Modified : date de modification - DateAccepted : date d’acceptation (exemple : acceptation d’une thèse par une université ou d’un article par un journal) - DateCopyrighted : date du copyright - DateSubmitted : date à laquelle la ressource a été soumise (exemple : un article soumis à un comité de lecture) · Exemple : <META NAME=”DC.Date.Created” CONTENT =”1954″> <META NAME=”DC.Date.Issued” SCHEME=”W3CDTF” CONTENT = “2000-04-13″> |
|
Type |
· Définition : nature ou genre du contenu de la ressource (termes décrivant des catégories, des fonctions ou des genres généraux) · Vocabulaires recommandés : DCMIType (types retenus : Collection, Dataset, Event, Image, Interactive Resource, Moving image, Physical object, Service, Software, Sound, Still image, Text) · Exemple : <META NAME=”DC.Type” SCHEME=”DCMIType” CONTENT =”Text”> |
|
Format |
· Définition : manifestation physique ou électronique de la ressource (type de média, dimensions de la ressource, logiciel ou matériel nécessaire pour accéder à la ressource…) · Vocabulaires recommandés : MIME ou IMT (types génériques : Application, Audio, Example, Image, Message, Model, Multipart, Text, Video) · Raffinements : - Extent : taille ou durée - Medium : matériel ou support physique · Exemple : <META NAME=”DC.Format” SCHEME=”IMT” CONTENT =”Text”> <META NAME=”DC.Format.Extent” CONTENT=”687 p.”> <META NAME=”DC.Format.Medium” CONTENT=”Document papier”> |
|
Identifier |
· Définition : référence non ambiguë à la ressource dans un contexte précis · Vocabulaires recommandés : URI (chaîne de caractères identifiant une ressource sur un réseau), ISBN (numéro international d’identification d’une monographie) · Raffinements : - BibliographicCitation : description bibliographique · Exemple : <META NAME=”DC.Identifier” SCHEME=”ISBN” CONTENT =”978- 2070515790″> <META NAME=”DC.Identifier.BibliographicCitation” CONTENT = “TOLKIEN, John Ronald Reuel. Le seigneur des anneaux. Tome 1 : La communauté de l’anneau. Paris : Gallimard jeunesse, 2000. 687p. ISBN : 978-2070515790″> |
|
Source |
· Définition : référence à une ressource à partir de laquelle la ressource décrite a été dérivée · Vocabulaires recommandés : URI · Exemple : Pas d’application possible pour la ressource choisie |
|
Language |
· Définition : langue du contenu de la ressource · Vocabulaires recommandés : RFC3066 (code de langue sur deux ou trois lettres) · Exemple : <META NAME=”DC.Language” SCHEME=”RFC3066″ CONTENT =”fr”> |
|
Relation |
· Définition : référence à une ressource qui a un rapport avec la ressource décrite · Vocabulaires recommandés : URI · Raffinements : - IsVersionOf : nouvelle version, adaptation ou modification de la ressource liée (changements de forme et/ou de contenu) - HasVersion : la ressource liée est une version modifiée de la ressource décrite - IsReplacedBy : la ressource décrite a été remplacée par la ressource liée - Replaces : la ressource décrite remplace la ressource liée - IsRequiredBy : on a besoin de la ressource décrite pour interpréter correctement la ressource liée - Requires : la ressource décrite a besoin de la ressource liée pour être correctement présentée ou transmise. - IsPartOf : la ressource décrite est une partie (physique ou logique) de la ressource liée - HasPart : la ressource décrite inclut, physiquement ou logiquement, la ressource liée - IsReferencedBy : la ressource décrite est citée ou liée par la ressource indiquée - References : la ressource décrite référence ou cite la ressource indiquée - IsFormatOf : la ressource décrite a le même contenu que la ressource liée, mais présenté sous une forme différente - HasFormat : la ressource décrite possède une variante sous une forme différente - ConformsTo : référence à un standard ou norme auquel se conforme la ressource décrite · Exemple : <META NAME=”DC.Relation.IsRequiredBy” CONTENT =”Le seigneur des anneaux. Tome 2 : Les deux tours”> <META NAME=”DC.Relation.IsRequiredBy” CONTENT =”Le seigneur des anneaux. Tome 3 : Le retour du roi”> |
|
Coverage |
· Définition : portée ou couverture spatio-temporelle de la ressource (position géographique, période de temps, juridiction…) · Vocabulaires recommandés : Point (point géographique), TGN (dictionnaire de noms de lieux), ISO3166 (codes de pays à deux lettres), Box (régions géographiques) pour la couverture spatiale. Period (intervalle de temps) ou W3CDTF (dates et heures) pour la couverture temporelle. · Raffinements : - Spatial : couverture spatiale du contenu de la ressource décrite - Temporal : couverture temporelle du contenu de la ressource décrite · Exemple : Un problème se pose : les lieux et dates de l’histoire sont imaginaires |
|
Rights |
· Définition : informations sur les droits sur et au sujet de la ressource (présence d’un copyright, lien vers le détenteur des droits…) · Raffinements : - Access Rights : indiquent qui peut accéder à la ressource ou quel est son niveau de sécurité - License : document légal donnant la permission d’utiliser la ressource · Exemple : <META NAME=”DC.Rights” CONTENT =”Copyright Gallimard Jeunesse”> |
Partie 3
En quelques lignes présentez, selon vous, 3 avantages essentiels du recours à Dublin Core et 3 inconvénients / problèmes possibles.
L’un des principaux avantages du Dublin Core réside dans sa simplicité d’utilisation. En effet, les éléments de description du Dublin Core sont clairs et facilement compréhensibles, permettant à n’importe qui, du professionnel des Sciences de l’information au non-initié, de décrire une ressource quelconque.
Un autre avantage du Dublin Core est sa flexibilité. Chacun peut, selon ses choix, adapter les éléments de base au type de document décrit : aucun élément n’est obligatoire, les éléments peuvent être raffinés ou non… Se flexibilité réside aussi dans le choix des intitulés des éléments de description : par exemple, le choix de l’intitulé « Creator » permet de faire autant référence à un auteur de roman qu’à un photographe.
Enfin, le dernier avantage du Dublin Core est sa progressive popularité. Son envergure est aujourd’hui internationale : on recense à l’heure actuelle plus d’une vingtaine de versions linguistiques du Dublin Core. De nombreux pays et métiers adoptent cette norme, grâce à l’implication du Dublin Core Metadata Initiative (la richesse de leur site web reflète d’ailleurs leur motivation et leur volonté de faire adopter cette norme).
Cependant, le Dublin Core connaît quelques faiblesses. Tout d’abord, cette norme peut paraître limitée pour la description de certains documents. Par exemple, concernant les photographies numériques, on peut se demander comment transcrire dans le Dublin Core les données techniques relatives à la prise de vue (résolution et orientation de l’image, vitesse d’obturation, marque de l’appareil photo…). C’est aussi le cas pour certains objets physiques comme les monographies. Le problème s’est d’ailleurs posé pour la ressource décrite dans la Partie 2 : comment traduire dans l’élément « Coverage », de manière normalisée, le fait que l’histoire du « Seigneur des Anneaux » se déroule dans un lieu imaginaire ?
Une autre limite du Dublin Core découle d’une de ses qualités évoquée plus haut. Il s’agit de sa flexibilité et de sa souplesse d’utilisation. En effet, ne rendre aucun élément obligatoire peut entraîner des dérives : chacun peut décider si tel champ sera renseigné ou non, ce qui peut constituer une solution de facilité. C’est aussi ce qui peut se passer pour l’utilisation des vocabulaires : aucun d’eux n’est obligatoire, chaque utilisateur peut donc choisir sa méthode de description (langage libre ou vocabulaires), entraînant alors des problèmes d’interopérabilité.
Enfin, le Dublin Core ne répond à l’heure actuelle qu’à des besoins de recherche et de repérage des ressources décrites. Il n’est pas vraiment adapté à la gestion des documents et à leur accès, semble trop insuffisant pour la description de collections…
Partie 4
Références bibliographiques utilisées
DCMI. Dublin Core Metadata Initiative [en ligne]. Mis à jour le 31 mars 2008 [consulté le 03 avril 2008]. Disponible sur <http://dublincore.org/>
HILLMANN Diane, TEASDALE Guy. « Guide d’utilisation du Dublin Core ». In Bibliothèque de l’Université Laval [en ligne]. 15 janvier 2001 [consulté le 13 mars 2008]. Disponible sur <http://www.bibl.ulaval.ca/DublinCore/usageguide-20000716fr.htm>
JACQUET, Christophe. « Métadonnées et Dublin Core ». In Openweb [en ligne]. Mis à jour le 02 juin 2003 [consulté le 12 mars 2008]. Disponible sur <http://openweb.eu.org/articles/dublin_core/>
« Le Dublin Core en bref ». In BiblioDoc.Francophonie.org [en ligne]. Mis à jour le 01 avril 2008 [consulté le 03 avril 2008]. Disponible sur <http://bibliodoc.francophonie.org/article.php3?id_article=177>
MOREL-PAIR, Catherine. Panorama des métadonnées pour les ressources électroniques [en ligne]. Arcachon : octobre 2005, 33 p. [consulté le 13 mars 2008]. Disponible sur <http://hal.archives-ouvertes.fr/docs/00/04/04/73/PDF/Metas_panorama_CMO.pdf>
ROUISSI, Soufiane. Cours de Métadonnées. IUT Michel de Montaigne – Université de Bordeaux 3.
VERCOUSTRE, Anne-Marie. « Eléments de métadonnées du Dublin Core, Version 1.1: Description de Référence ». In Institut national de recherche en informatique et en automatique [en ligne]. 20 avril 2000 [consulté le 12 mars 2008]. Disponible sur <http://www-rocq.inria.fr/~vercoust/METADATA/DC-fr.1.1.html>
WIKIPEDIA. « Dublin Core ». In Wikipédia : l’encyclopédie libre [en ligne]. Mis à jour le 31 mars 2008 [consulté le 13 mars 2008]. Disponible sur <http://fr.wikipedia.org/wiki/Dublin_Core>
[1] Les métadonnées constituent un ensemble d’informations structuré qui permet de décrire, d’identifier et d’utiliser de façon pertinente un objet ou une donnée.