-
La plus grande partie des métadonnées actuelles de HAL peut être validée dans le contexte du premier niveau. L’annexe 1 détaille l’ensemble des métadonnées actuellement utilisées dans HAL ou souhaitées par le groupe de travail. Des précisions sont données sur le caractère obligatoire ou non de certaines d’entre elles.
-
Pour se rapprocher des standards, il serait souhaitable que certains éléments de métadonnées puissent être qualifiés (par une langue, un système de classification, un langage documentaire). Ce n’est pas nécessaire actuellement au premier niveau mais cette possibilité pourrait être envisagée dans les échanges entre systèmes (second niveau).
-
Les éléments de métadonnées suivants devront être précisés et enrichis :
- droits liés aux documents déposés (licences Creative Commons ?)
- financements des recherches donnant lieu à publication (structuration)
-
Des travaux complémentaires sont nécessaires pour :
- les métadonnées d’affiliation (en relation avec les travaux en cours de l’Amue sur les référentiels et de l’OST pour les recommandations)
- les systèmes d’identifiants des Archives Ouvertes (en relation avec un autre groupe du CoST)
2.3Propositions pour les étapes suivantes
Le mise en œuvre d’échanges de métadonnées entre systèmes différents s’appuie sur le définition de formats d’échange et sur l’application de standards.
Aujourd’hui, les métadonnées de HAL sont rendues accessibles à l’extérieur grâce au protocole standard OAI-PMH (http://www.openarchives.org ), sous deux formats : Dublin Core non qualité (obligatoire en OAI-PMH) + un format spécifique à HAL. L’import de métadonnées dans HAL utilise d’autres outils (API spécifique + Web Services utilisant la technologie SOAP).
Le groupe de travail souhaite que les mécanismes d’échange actuellement disponibles puissent être élargis et si possible partagés par l’ensemble des systèmes concernés par les Archives Ouvertes (HAL + systèmes d’information locaux). Cela concerne à la fois la structuration des métadonnées (schémas) et les modèles d’échanges de données.
-
Pour les schémas de métadonnées, il est souhaitable de prendre en compte les travaux en cours sur les Eprints Application Profiles (profils d’application Dublin Core pour la description des publications scientifiques – travaux en cours du JISC et de l’UKOLN – voir à ce sujet : http://www.ukoln.ac.uk/repositories/digirep/index/Eprints_Application_Profile );
-
Pour les protocoles d’échange de données, il faut se situer par rapport aux travaux OAI-ORE (Object Reuse and Exchange : échanges d’informations entre réservoirs de documents numériques – voir : http://www.openarchives.org/ore/ ).
Propositions au CoStra
-
Construire un schéma de métadonnées élargi, permettant à HAL et aux autres systèmes développés dans les établissements de s’appuyer sur des éléments communs. Ce travail devra se faire en tenant compte des standards existants et des travaux déjà engagés. Le modèle devrait être
- compatible avec le schéma actuel de HAL (complémentaire)
- compatible avec les grands standards utilisés dans les systèmes des établissements
-
Donner à ce schéma de métadonnées une forme utilisable pour les différents modèles d’échange de données :
- schéma XML
- spécifications d’utilisation avec le protocole OAI-PMH
- autres spécifications éventuelles…
-
Elaborer des recommandations pour la bonne utilisation de ces schémas dans les échanges entres HAL et les systèmes (et éventuellement entre les systèmes).
-
Par ailleurs, poursuivre les travaux sur les métadonnées d’affiliation.
3Typologie des documents et des dépôts
Les types de publications utilisés dans les Archives Ouvertes des différents organismes ont été examinés et comparés ; il a également été tenu compte de la classification proposée par le ministère pour les rapports quadriennaux.
Durant le dernier trimestre 2006, le CCSD a déjà modifié la liste des types de documents utilisée dans HAL, en tenant compte de la classification venant du ministère. De plus, il n’y a maintenant plus de différence entre HAL et HAL-SHS pour cette typologie de publications.
-
La typologie de documents retenue pour les Archives Ouvertes a comme premier objectif d’être utilisable directement par les chercheurs et de correspondre aux cas d’usage les plus courants.
-
Le groupe de travail valide la liste suivante, déjà mise en place dans HAL fin 2006 :
- Articles dans des revues avec comité de lecture
- Articles dans des revues sans comité de lecture
- Conférences invitées
- Communications avec actes
- Communications sans actes
- Ouvrages scientifiques
- Chapitres d'ouvrages scientifiques
- cas des Brevets à voir …
-
A cette liste, peuvent s’ajouter les types suivants, en dehors du périmètre strict de l’Archive Ouverte mais gérés dans Tel :
- Thèses
- Habilitation à Diriger des Recherches
-
D’autres types de publications (cours, rapports, ouvrages ou articles de vulgarisation…) peuvent figurer dans les Archives Institutionnelles des établissements mais n’ont pas leur place dans l’Archive Ouverte commune.
-
Le groupe de travail recommande que le cas des documents non publiés (prépublications) soit prévu explicitement dans les types de documents, au moins lors des échanges de données entre systèmes.
Pour les documents non publiés (déposés dans l’Archive Ouverte sans référence bibliographique), il serait souhaitable que l’auteur qui dépose puisse préciser s’il s’agit d’un document soumis à publication (par l’intermédiaire d’une simple case à cocher).
Par ailleurs, le groupe de travail recommande que les modifications portant sur le type de document soient explicites et traçables, en particulier dans le cas d’un document déposé dans HAL avant publication (sans référence bibliographique) : au moment où l’article est publié et où sa référence bibliographique est ajoutée dans HAL, il faut que le statut du document initialement déposé reste celui d’une « prépublication ».
Il serait intéressant qu’un filigrane plus riche soit intégré dans le document PDF est généré, de manière à préciser le statut du document au moment de son dépôt dans HAL (cette information liée au document lui-même ne pourrait pas être perdue par la suite). On pourrait même envisager l’ajout systématique d’un encart au début de chaque document PDF, reprenant les informations (métadonnées) utiles pour le lecteur qui consulte ou télécharge un document présent dans HAL.
Dostları ilə paylaş: |