advertisement

Metadonnees et SID

67 %
33 %
advertisement
Information about Metadonnees et SID
Technology

Published on March 23, 2009

Author: Dalb

Source: slideshare.net

Description

Exposé sur les métadonnées dans le cadre des systèmes d'information documentaire (SID)
advertisement

Groupe Sectoriel ATC Aménagement – Transport - Construction Réunion du 24 mars 2009 Sylvie Dalbin - ATD [email_address] Métadonnées

Plan du support Objectif et contexte Ressources Métadonnées XML Modélisation Axes d’évolution

Objectif et contexte

Ressources

Métadonnées

XML

Modélisation

Axes d’évolution

1. OBJECTIF ET CONTEXTE

Objectif : Métadonnées et SID Métadonnées Pour la représentation et l’accès à l’information Impacts sur les Systèmes d’information documentaire (SID) Sur les outils documentaires et informatiques, de production, gestion et recherche Perpectives Accès à l’information à l’ère de la Société de l’Information et du Web Prendre acte des besoins et des pratiques des Utilisateurs des SID Mise en perspective professionnelle Synthèse du questionnaire transmis le 17/03/2009

Métadonnées

Pour la représentation et l’accès à l’information

Impacts sur les Systèmes d’information documentaire (SID)

Sur les outils documentaires et informatiques, de production, gestion et recherche

Perpectives

Accès à l’information à l’ère de la Société de l’Information et du Web

Prendre acte des besoins et des pratiques des Utilisateurs des SID

Mise en perspective professionnelle

Synthèse du questionnaire transmis le 17/03/2009

Synthèse - Fonctions (1) 22 répondants du Groupe ATC en 3 jours, dont 15 présents à la réunion

ADéLIe (1) - un exemple ADministration de Données locaLIsées Système de stockage, de catalogage et de mise à disposition du patrimoine géographique du Ministère (Equip) … sous forme de lots de données géographiques Aérodromes de Bourgogne - FICHE_2760 http://adelie.application.equipement.gouv.fr/syntheseFiche.do?fiche=2760&visu=ok&page=1

ADéLIe (2) - site Internet Zones de la fiche Export de la fiche en XML

ADéLIe (3) Patrimoine géographique sous forme de lots de données ( tableaux, cartes, statistiques, écrits, etc), stables et datés accompagnés de métadonnées à la norme ISO 19115 - échangeables au format XML conforme à la norme ISO19139. hébergés sur serveurs - central, local ou externe -alimentés par une application web centralisée alimentés par des administrateurs de données localisées (ADL) consultables à travers un moteur de recherche , accessible sur i-carré, ADER, Internet en fonction des droits d'accès

sous forme de lots de données ( tableaux, cartes, statistiques, écrits, etc), stables et datés

accompagnés de métadonnées à la norme ISO 19115 - échangeables au format XML conforme à la norme ISO19139.

hébergés sur serveurs - central, local ou externe -alimentés par une application web centralisée

alimentés par des administrateurs de données localisées (ADL)

consultables à travers un moteur de recherche , accessible sur i-carré, ADER, Internet en fonction des droits d'accès

Thèmes abordés (?) Contrôle XML (SGBD) Rdf - uri Schémas de métadonnées Ressource numérique structurée De gros manuels Saisie Import/export SGBD MCD Notice (bibliographique) Document Documentation du système Process Système informatique Système documentaire Document Utilisateur producteur / Utilisateur final Outils documentaires et informatiques Hier Aujourd’hui granularité modèle métier norme interopérabilité Système documenté

2. RESSOURCES Ressources numériques structurées

ADéLIe (4) – Données, Documents, Informations Information géographique Une collection constituée par les besoins et pratiques du métier (Equipement) Quelle que soit la nature et le support de l’information tableaux, cartes, statistiques, écrits, etc Granularité adaptée aux besoins Ici des lots regroupés par rapport à la localisation Informations et documents numériques

Information géographique

Une collection constituée par les besoins et pratiques du métier (Equipement)

Quelle que soit la nature et le support de l’information

tableaux, cartes, statistiques, écrits, etc

Granularité adaptée aux besoins

Ici des lots regroupés par rapport à la localisation

Synthèse – Informations (2) 22 répondants du Groupe ATC en 3 jours, dont 15 présents à la réunion

Synthèse - Médias (3) 22 répondants du Groupe ATC en 3 jours, dont 15 présents à la réunion Catégories du Dublin Core

3. METADONNEES Représentation documentaire métier

ADéLIe (5) Eléments de la fiche descriptive… titre version dates (création, révision, édition), producteur des données Aperçu droits d'accès aux données résumé type de données couverture administrative système de coordonnées résolution/échelle de référence service gestionnaire des données, contact pour les données Ce que l’on voit à l’écran

titre

version

dates (création, révision, édition),

producteur des données

Aperçu

droits d'accès aux données

résumé

type de données

couverture administrative

système de coordonnées

résolution/échelle de référence

service gestionnaire des données,

contact pour les données

Adélie (6) … structurée éléments de données = métadonnées regroupés et hiérarchisés = schéma de métadonnées => une représentation des ressources , ici un lot de données géographiques. Ce que l’on voit derrière l’écran Logiciel XMLEditor ou Amaya

éléments de données = métadonnées

regroupés et hiérarchisés = schéma de métadonnées

=> une représentation des ressources , ici un lot de données géographiques.

Catégories de métadonnées ns4:MD_Metadata ns4:fileIdentifier ns4:language ns4:characterSet ns4:hierarchyLevel ns4:hierarchyLevelName ns4:contact ns4:dataStamp ns4:metadataStandardName ns4:metadataStandardVersion ns4:referenceSystemInfo ns4:identificationInfo ns4:distributionInfo ns4:dataQualityInfo ns4:metadataConstraints Représentation de la ressource caractéristiques intrinsèques, contexte de production ns4:referenceSystemInfo Administration de la ressource ns4:contact Métadonnées structurelles ns4:hierarchyLevel (contexte) Méta-métadonnées ns4:contact Catégories fréquemment citées

ns4:MD_Metadata

ns4:fileIdentifier

ns4:language

ns4:characterSet

ns4:hierarchyLevel

ns4:hierarchyLevelName

ns4:contact

ns4:dataStamp

ns4:metadataStandardName

ns4:metadataStandardVersion

ns4:referenceSystemInfo

ns4:identificationInfo

ns4:distributionInfo

ns4:dataQualityInfo

ns4:metadataConstraints

Représentation de la ressource caractéristiques intrinsèques, contexte de production

ns4:referenceSystemInfo

Administration de la ressource

ns4:contact

Métadonnées structurelles

ns4:hierarchyLevel (contexte)

Méta-métadonnées

ns4:contact

Standardisation - Normalisation Suivant les objets représentés La description d’une ressource Norme bibliothéconomique telle RDA ou Onyx La ressource elle-même DocBook d’OASIS pour les documents techniques, TEI… Par élément de données Langue (rfc4646), contact (vCard), identifiants … Par Métier - producteurs Secteur de l’information géographique, Secteur de la formation : LOM, CDR, … Par Fonctions Transports de données : METS, XMP… Nouveaux « langages documentaires »

Suivant les objets représentés

La description d’une ressource

Norme bibliothéconomique telle RDA ou Onyx

La ressource elle-même

DocBook d’OASIS pour les documents techniques, TEI…

Par élément de données

Langue (rfc4646), contact (vCard), identifiants …

Par Métier - producteurs

Secteur de l’information géographique, Secteur de la formation : LOM, CDR, …

Par Fonctions

Transports de données : METS, XMP…

Schémas imbriqués Une ressource « OAI »… Schéma OAI-PMH transportant des ressources LOM Schéma LOM

Métadonnées et Logiciels Plusieurs jeux de métadonnées Diversité des modèles Relations entre modèles Mobilité des modèles Complexité d’articulation entre ces schémas Distinguer production et recherche Production en locale ? sur plusieurs systèmes ? Recherche fédérée sur d’autres ressources Ressources à traiter et celles à intégrer au portail : quel recouvrement ? Un point d’architecture aussi pour professionnels de l’infodoc, essentiel pour les questions d’interopérabilité et d’économie

Plusieurs jeux de métadonnées

Diversité des modèles

Relations entre modèles

Mobilité des modèles

Complexité d’articulation entre ces schémas

Distinguer production et recherche

Production en locale ? sur plusieurs systèmes ?

Recherche fédérée sur d’autres ressources

Ressources à traiter et celles à intégrer au portail : quel recouvrement ?

Un point d’architecture aussi pour professionnels de l’infodoc, essentiel pour les questions d’interopérabilité et d’économie

Synthèse - Logiciels (4) 22 répondants du Groupe ATC en 3 jours, dont 15 présents à la réunion

4. XML Représentation informatique et applications de gestion et de recherche

XML - Langage de description Format ouvert : texte Non propriétaire Ajoute des informations aux métadonnées Chaîne de caractère Localise le référentiel avec une URI Structuration formelle Encadre les métadonnées Balises: < > et </ > Arbre XML Nouveaux langages informatiques

Format ouvert : texte

Non propriétaire

Ajoute des informations aux métadonnées

Chaîne de caractère

Localise le référentiel avec une URI

Structuration formelle

Encadre les métadonnées

Balises: < > et </ >

Arbre XML

XML et SGBD XML: format de transfert ou de stockage ? Débats dans la communauté informatique SGBD : données encapsulées dans des tables, documentation externe aux fichiers véhiculés, peu souple XML : données « ouvertes », auto-documentées grâce à RDF Usage pour le stockage des index en recherche Exploitation directe par les moteurs de recherche Un point technique pour informaticiens, essentielles pour les questions d’interopérabilité et d’économie

XML: format de transfert ou de stockage ?

Débats dans la communauté informatique

SGBD : données encapsulées dans des tables, documentation externe aux fichiers véhiculés, peu souple

XML : données « ouvertes », auto-documentées grâce à RDF

Usage pour le stockage des index en recherche

Exploitation directe par les moteurs de recherche

Un point technique pour informaticiens, essentielles pour les questions d’interopérabilité et d’économie

5. MODELISATION Processus et outils

Processus de conception La Vie Les Choses de la Vie A - Représentation Métier A1 - Modéliser et formaliser le modèle métier A2 - Développer des Référentiels métier B - Représentation Informatique B1 - Concevoir un modèle informatique sur la base du modèle conceptuel métier B2 - Développer un schéma de données

La Vie

Les Choses de la Vie

A - Représentation Métier

A1 - Modéliser et formaliser le modèle métier

A2 - Développer des Référentiels métier

B - Représentation Informatique

B1 - Concevoir un modèle informatique sur la base du modèle conceptuel métier

B2 - Développer un schéma de données

Modèle entités-associations Architecte Pont A conçu nom prénom date nom-pont lieu fonction durée matériau 1, n 1, n Identifiant Identifiant liaison entre attribut et entité ou association et entité Classe d’entité Attribut matériau Pont A conçu Classe d’association Cardinalité (1-n). Ici, on suppose qu’un pont peut être conçu par 1 ou n architectes. Classe d’entités / associations : regroupement d’entités ou d’associations de même nature Idendifiant : chaque occurrence est repérée de manière unique et sans ambiguïté pour être distinguée de toutes les autres Ce vocabulaire est variable en fonction de l’origine du locuteur comme objet (entité), propriété (attribut) ou valeur et relation (association)

Diagramme UML relation est_unterme_préféré Entités Thésaurus Concepts Termes Attributs du terme: langue, source… Draft Schema np25964 relation terme: a_comme_définition

Administration des métadonnées Documenter les applications Auto-référencement ? RDF – grâce à une syntaxe formelle permet de documenter rigoureusement les métadonnées Documenter « écrite »  ISO 11179 (MDR) ISO 9735-2:2002 données composites Enregistrer schémas et profils d’application Agences d’enregistrement: ISO 11179, par métiers Profils d’application schéma + règle + système d’encodage + tableau de concordance

Documenter les applications

Auto-référencement ?

RDF – grâce à une syntaxe formelle permet de documenter rigoureusement les métadonnées

Documenter « écrite » 

ISO 11179 (MDR)

ISO 9735-2:2002 données composites

Enregistrer schémas et profils d’application

Agences d’enregistrement: ISO 11179, par métiers

Profils d’application

schéma + règle + système d’encodage + tableau de concordance

Vocabulaire RDF Documenter les métadonnées <?xml version=&quot;1.0&quot;?> <!DOCTYPE rdf:RDF PUBLIC &quot;-//DUBLIN CORE//DCMES DTD 2002/07/31//EN&quot; &quot;http://dublincore.org/documents/2002/07/31/dcmes-xml/dcmes-xml-dtd.dtd&quot;> <rdf:RDF xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot; xmlns:dc=&quot;http://purl.org/dc/elements/1.1/&quot;> <rdf:Description rdf:about=&quot;http://www.ilrt.bristol.ac.uk/people/cmdjb/&quot;> < dc:title >Dave Beckett's Home Page</dc:title> < dc:creator >Dave Beckett</dc:creator> < dc:publisher >ILRT, University of Bristol</dc:publisher> < dc:date >2002-07-31</dc:date> </rdf:Description > </rdf:RDF> Doc. XML Doc. RDF Doc Elements du Dublin Core Doc schema XML du Dublin Core / RDF ( espace de nom) Elements du Dublin Core

<?xml version=&quot;1.0&quot;?>

<!DOCTYPE rdf:RDF PUBLIC &quot;-//DUBLIN CORE//DCMES DTD 2002/07/31//EN&quot;

&quot;http://dublincore.org/documents/2002/07/31/dcmes-xml/dcmes-xml-dtd.dtd&quot;>

<rdf:RDF xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot; xmlns:dc=&quot;http://purl.org/dc/elements/1.1/&quot;>

<rdf:Description rdf:about=&quot;http://www.ilrt.bristol.ac.uk/people/cmdjb/&quot;>

< dc:title >Dave Beckett's Home Page</dc:title>

< dc:creator >Dave Beckett</dc:creator>

< dc:publisher >ILRT, University of Bristol</dc:publisher>

< dc:date >2002-07-31</dc:date>

</rdf:Description >

</rdf:RDF>

En résumé Langages à tous les étages Langage : un moyen d'expression et de représentation Langage de représentation des SI Représention graphique UML, entité-attribut-classe, Schémas XML Langage de représentation des ressources De la notice aux schémas de métadonnées interopérables Langages de représentation des notions Sert à alimenter les schémas de métadonnées Des listes d’autorité aux référentiels sémantiques Langage de représentation des métadonnées RDF Pour chacun : vocabulaire - syntaxe - sémantique

Langage : un moyen d'expression et de représentation

Langage de représentation des SI

Représention graphique UML, entité-attribut-classe, Schémas XML

Langage de représentation des ressources

De la notice aux schémas de métadonnées interopérables

Langages de représentation des notions

Sert à alimenter les schémas de métadonnées

Des listes d’autorité aux référentiels sémantiques

Langage de représentation des métadonnées RDF

Pour chacun : vocabulaire - syntaxe - sémantique

6. AXES D’EVOLUTION #1 - Des listes d’autorité aux répertoires sémantiques #2 – Pour une convergence des modèles documentaires #3 – Continuum et réexploitation #4 – Plonger dans les ressources numériques

#1 - Des lexiques contr ôlés …. Personne Géographie Genres… Réservoirs de vocabulaires désambigu ïsés Nom DateNaissance/Mort ID Titre Auteur Editeur Date Support … Descripteurs Géographiques Personnes Thèmes Répertoire Documents Personnes Géographie Lexiques contr ôlés Ressource

ID

Titre

Auteur

Editeur

Date

Support



Descripteurs

Géographiques

Personnes

Thèmes

. … aux répertoires sémantiques Personne Géographie Genres… Réservoirs de vocabulaires désambigu ïsés pouvant servir de Base de connaissance qualifiée ID Nom DateNaissance/Mort Pseudo PaysNaissance TypePublication GenrePublication AireLinguistique Editeur … ID Titre Auteur Editeur Date Support Genre Lieu Personnage … Répertoire Documents Répertoire Personnes Répertoire Géographie Ressource Ressource

#2 – Pour une convergence des modèles documentaires biblio-doc RM Archives KM

#3 Continuum et réexploitation Continuum - de la création à l’exploitation des ressources Métadonnées à la source : « recyclage infini » des métadonnées produites, et non (re)création Ne pas rester à la lisière du document biblio-doc RM Archives KM

Continuum - de la création à l’exploitation des ressources

Métadonnées à la source : « recyclage infini » des métadonnées produites, et non (re)création

Ne pas rester à la lisière du document

#4 Plonger dans les ressources numériques Etablir des schémas de représentation des contenus Exemple : les thèses Etat de l’art Méthode proposée Expérimentation Perspective Terminologie Ressources liées (bibliographie) Articuler les métadonnées description de la ressource description de son contenu avec des éléments de son contexte Contenu de la thèse (pdf) C. Roussey - Une méthode d’indexation sémantique adaptée aux corpus multilingues, 2001 Etat de l’art Méthode proposée Expérimentation Perspective Terminologie Ressource liée (ici un article)

Etablir des schémas de représentation des contenus

Exemple : les thèses

Etat de l’art

Méthode proposée

Expérimentation

Perspective

Terminologie

Ressources liées (bibliographie)

Articuler les métadonnées

description de la ressource

description de son contenu

avec des éléments de son contexte

Contenu de la thèse (pdf)

Complexité de mise en œuvre Malgré les qualités des technologies du Web Ouverture, interopérabilité technique, normalisation,… Difficultés de conception et de mise en œuvre Grande mobilité : normalisation, méthodes et outils Compétences multiples à associer Contenu et systèmes ouverts S’ouvrir aux pratiques des Utilisateurs Economie des dispositifs et coût des transformations Accompagner le changement : formation Adopter un esprit ouvert et critique sur nos pratiques

Malgré les qualités des technologies du Web

Ouverture, interopérabilité technique, normalisation,…

Difficultés de conception et de mise en œuvre

Grande mobilité : normalisation, méthodes et outils

Compétences multiples à associer

Contenu et systèmes ouverts

S’ouvrir aux pratiques des Utilisateurs

Economie des dispositifs et coût des transformations

Accompagner le changement : formation

Adopter un esprit ouvert et critique sur nos pratiques

Merci ! Sylvie Dalbin [email_address]

Annexe 1 - Description des métadonnées Selon la norme ISO 11179

Annexe 2 - Représentation fine et métadonnées composites Représentation des langues RFC 4646 (Tags for Identifying Languages) Finalités Accès direct aux ressources Répondre précisément aux besoins Prendre en compte les particularismes régionaux à travers le monde Intégré à Dubin Core / ISO 15836 zh - Latn - CN [ISO 639-1] [ISO 15924] [ISO 3166] de - CH - 1996 Allemand utilisé en Suisse, écrit après la réforme de l'orthographe entamée en 1996.

Représentation des langues

RFC 4646 (Tags for Identifying Languages)

Finalités

Accès direct aux ressources

Répondre précisément aux besoins

Prendre en compte les particularismes régionaux à travers le monde

Intégré à Dubin Core / ISO 15836

zh - Latn - CN

[ISO 639-1] [ISO 15924] [ISO 3166]

de - CH - 1996

Allemand utilisé en Suisse, écrit après la réforme de l'orthographe entamée en 1996.

Annexe 3 – Arbre XML et schéma de métadonnées

 

 

 

Add a comment

Related presentations

Presentación que realice en el Evento Nacional de Gobierno Abierto, realizado los ...

In this presentation we will describe our experience developing with a highly dyna...

Presentation to the LITA Forum 7th November 2014 Albuquerque, NM

Un recorrido por los cambios que nos generará el wearabletech en el futuro

Um paralelo entre as novidades & mercado em Wearable Computing e Tecnologias Assis...

Microsoft finally joins the smartwatch and fitness tracker game by introducing the...

Related pages

pdftk - PDF : Lire et Éditer - Logiciels Libres - Framasoft

Je recherchais un petit soft simple et gratuit pour combiner plusieurs PDF en 1 et après avoir essayé d’installer plusieurs demo de sharewares ...
Read more

Ingénierie du document numérique | Inforsid

Read more

ADBS Groupe Référentiel métiers

7 Administrateur(trice) de SID ADBS – PROJET RÉFÉRENTIEL DES MÉTIERS – JUIN 2007 Compétences Organiser, structurer et gérer documents et contenus ...
Read more

RAPPORT DE L’OSS AU CRIC SUR LES MESURES PRISES POUR ...

rapport de l’oss au cric sur les mesures prises pour soutenir l’elaboration et la mise en Œuvre des programmes d’action de lutte contre la ...
Read more

Measuring and Analysing the Variations of Program ...

The recent growth in the number of precessing units in today's multicore processor architectures enables multiple threads to execute simultanesiouly ...
Read more

GRÁINNE NÍ MHÁILLE OR « GRANUAILE », AN IRISH WOMAN ...

Gráinne Ní Mháille (aka Gráinne Mhaol, or “Granuaile”) stands out as a unique figure in Irish History and national symbolism; her fame and ...
Read more

Improving load/store queues usage in scientific computing

Instead of proposing a hardware solution to improve load/store queues, as done in [G. Chrysos et al., (1998), S. Sethumadhavan et al., ... Sid-Ahmed-Ali ...
Read more

Tascam HS-P82 - Thomann France

Enregistreur multi-piste professionnel Utilise 2 cartes CF (enregistrement, de sauvegarde, de mise en miroir et transparente coups A / B - avec la version ...
Read more