Titre document



Yüklə 72,08 Kb.
tarix03.11.2017
ölçüsü72,08 Kb.
#29839

Principes pour les échanges
entre systèmes locaux et HAL

Version

Date

Statut

Auteurs / Contributeurs

Commentaires

0.5

2007-05-10

travail

Dominique Cavet

Première rédaction

0.6

2007-05-14

travail

Groupe + Dominique Cavet

Prise en compte de la réunion du 11 mai au CCSd

0.7

2007-05-31

travail

D. Cavet + D. Charnay + CCSd

Rédaction des annexes

0.8

2007-07-19

Proposition finale

D. Cavet + CCSd

Prise en compte de la réunion du 13 juillet 2007

1.0

2007-10-29

Validé

GR2 + GR5

Validation par les membres du groupe


Membres du groupe de travail : Francis André (MENESR – Inist) – Thierry Bédouin (Université Rennes 1) – Christine Berthaud (ISH Lyon) – Dominique Cavet (IRD) – Daniel Charnay (CCSD) – Sophie Desseigne (Couperin) – Danièle Duclos-Faure (MENESR, SDBIS) – Muriel Foulonneau (CCSD) – Emmanuelle Jannes-Ober (Cemagref) – Monique Joly (Insa Lyon) – Agnès Raymond-Denise (Institut Pasteur). Ont également participé au groupe : Laurent Capelli (CCSD) – Rachel Crépy (MENESR) – Carole Giansily (Cemagref) – Marie-Anne Leriche (CEA) – Jean-François Lutz (Université de Metz) – Martine Pochard (Université de Franche Comté) – Brigitte Prudhomme (Insa Lyon) – Marie-Thérèse Rebat (MENESR).

Ce document propose des principes et des règles d’interopérabilité pour les situations où des documents scientifiques doivent être référencés à la fois dans l’archive ouverte commune archives-ouvertes.fr et dans d’autres systèmes propres aux établissements.


Préliminaires


  1. Dans tout le document, on désignera par HAL l’archive ouverte commune archives-ouvertes.fr, résultant de l’accord entre les organismes de recherche, les universités et les grandes écoles.

HAL est destiné à accueillir tous les documents scientifiques d'un niveau équivalent à celui des articles que les chercheurs soumettent à des éditeurs scientifiques. Lorsqu’ils correspondent à des publications, les documents sont accompagnés de la référence de la publication éditée. Le dépôt se fait à l’initiative des chercheurs. HAL n’a pas vocation à servir d’outil de suivi ou d’évaluation des publications et/ou des structures.

HAL assure l’archivage pérenne de l’ensemble des données de l’archive ouvertes commune.



  1. On désignera par Système Local tous les systèmes pouvant être mis en place dans les établissements : systèmes d’information, systèmes documentaires, archives institutionnelles…

Les Systèmes Locaux ont en général des finalités supplémentaires de suivi des publications, voire d’évaluation ou de production d’indicateurs. Il peuvent contenir aussi bien des notices [Annexe 2] que des documents numériques.

Les Systèmes Locaux relèvent de la politique des établissements et répondent à des objectifs de valorisation et de diffusion des publications propres à un établissement ou/et à un réseau d’établissements, ne relevant pas forcément du périmètre de HAL (rapports, cours, littérature grise…). A ce titre les Systèmes Locaux doivent être interopérables avec d’autres archives institutionnelles, thématiques, nationales et internationales.



  1. Un schéma de métadonnées, désigné sous le nom de AO.fr, est défini pour permettre des échanges de données entre HAL et les Systèmes Locaux, en utilisant des protocoles définis dans ce document.

Dans l’état actuel des systèmes d’archives ouvertes, en France et au niveau mondial, il n’existe pas encore de dispositif opérationnel d’attribution d’identifiants uniques qui pourrait être mise en œuvre pour HAL et les Systèmes Locaux. Ce document fait donc des propositions en tenant compte de cette situation, afin de ne pas retarder les projets en cours. Il devra bien sûr être adapté et donner lieu à une nouvelle version si un système d’identifiants uniques est retenu ultérieurement.

Dans ce document, les termes figurant en petites capitales (peuvent, doivent, devraient, etc.) doivent être interprétés au sens de la RFC 21191, qui est couramment utilisée pour préciser leur signification dans le contexte d’un document de recommandation.


Principes généraux


  1. HAL et les Systèmes Locaux doivent respecter les règles générales concernant les Archives Ouvertes au niveau mondial :

  • le dépôt des documents se fait sous la responsabilité des auteurs, avec l’accord de l’ensemble des co-auteurs et dans le respect du droit des éditeurs pour les publications éditées ;

  • les documents ne peuvent être retirés, une fois déposés ; seules des versions ultérieures (affichées de manière préférentielle) peuvent être ajoutées pour compléter ou amender le dépôt initial2 ;

  • la consultation ou l’impression des documents ne peut être bridée de quelque manière que ce soit (protections PDF, etc. ; plus généralement les protections PDF de type « interdire la modification » doivent être appréhendés dans un contexte d’archivage à long terme) ;

  • la qualité scientifique des documents est vérifiée3 ;

  • le dépôt se fait dans l’un des formats : rtf, TeX/LateX, pdf, ps et HTML, XML, etc., mais une version lisible avec des outils gratuits (pdf, ps) sera toujours mise à disposition ;

  • il est possible de définir une période d’embargo pour la consultation des documents numériques.

  1. Les documents numériques en texte intégral relevant du périmètre de HAL doivent être stockés dans HAL.

  2. Les Systèmes Locaux peuvent stocker une copie des documents numériques en texte intégral, mais ils doivent faire référence au document stocké dans HAL, dès qu’il existe [Annexe 3].

Cette règle vise à favoriser une référence unique pour les documents de l’archive ouverte commune. Il faut éviter que le même document puisse être cité de plusieurs manières ; c’est l’identifiant de HAL et l’URL du document dans HAL qu’on devrait utiliser lorsqu’on cite un document dans une page Web ou depuis une notice d’un Système Local.

  1. Les métadonnées associées aux documents de HAL correspondent à la description standard d’un document scientifique4. Le schéma de métadonnées est conforme au tronc commun de métadonnées décrit dans le premier rapport d’étape au CoStrAO5.

  2. D’autres métadonnées peuvent être présentes dans un Système Local. Cependant, les éléments de métadonnées correspondant au tronc commun doivent être identiques dans le Système Local et dans HAL.

Principes pour l’alimentation de HAL


  1. L’alimentation de HAL se fait :

  • soit directement, par l’intermédiaire de l’interface de dépôt de HAL ou de l’un des portails de dépôt de HAL ; la saisie dans HAL peut être assistée6, en utilisant des métadonnées issues d’autres bases7 ou de Systèmes Locaux ;

  • soit indirectement, depuis un Système Local, par l’intermédiaire des Web Services [Annexe 4] proposés pour « pousser » dans HAL les métadonnées et les fichiers correspondants ; les Web Services permettent aussi bien une alimentation de HAL au moment de l’entrée d’un document dans le Système Local qu’une alimentation en différé, éventuellement par lots.

  1. Pour bénéficier de la procédure de saisie assistée dans HAL, les Systèmes Locaux doivent rendre accessible à HAL des métadonnées au format AO.fr pour le document concerné [Annexe 5].

Récupération des données de HAL dans les Systèmes Locaux


  1. Les métadonnées de HAL doivent être rendues accessibles au Système Locaux par l’intermédiaire du protocole OAI-PMH et du schéma de métadonnées AO.fr. Les Systèmes Locaux qui souhaitent récupérer des données de HAL doivent utiliser une procédure de moissonnage de ce protocole (les autres formats de métadonnées de HAL leur restent cependant accessibles).

Des facilités seront mises en place par le CCSd pour rendre également accessibles les documents numériques correspondants. L’URL des fichiers sera fournie dans le format AO.fr ; cependant, il ne s’agit pas d’une URL pérenne : elle doit être utilisée pour le téléchargement de façon synchrone avec le moissonnage.

  1. Pour chaque Système Local, HAL gérera un Set8 particulier permettant d’effectuer un moissonnage sélectif spécifique au Système Local.

Identifiants dans HAL et dans les Systèmes Locaux


  1. HAL gère un identifiant unique pour chaque document [Annexe 6].

  2. C’est l’identifiant unique de HAL qui garantit l’unicité de l’URL propre à chaque document9 de l’Archive Ouverte et qui permet de le citer de manière pérenne. Les Systèmes Locaux devraient utiliser cet identifiant pour faire des liens sur les documents de l’Archive Ouverte [Annexe 3].

  3. Pour assurer l’interopérabilité avec HAL, un Système Local devrait également gérer un identifiant unique pour chaque document [Annexe 7].

  4. Si l’alimentation de HAL se fait à partir d’un Système Local gérant des identifiants uniques, le Système Local peut fournir à HAL ses identifiants de documents ; dans ce cas, HAL doit conserver ces identifiants et doit les rendre accessibles dans le schéma AO.fr, lorsqu’il expose des métadonnées.

Règles de bonne pratique pour l’alimentation


Pour assurer la qualité de l’Archive Ouverte et la visibilité optimale des publications qui la composent, il faut que chaque document soit référencé dans HAL et que les documents numériques associés soient effectivement stockés dans HAL (voir ci-dessus).

La situation normale pour une publication ayant des auteurs dans un ou plusieurs organismes ou établissements de recherche français est la suivante :



  • Les documents numériques de la publication devraient être déposés dans HAL avec les métadonnées correspondantes.

  • La publication peut être référencée dans chacun des Systèmes Locaux d’organismes ou d’établissements dont des personnels ont contribué à la publication.

  • Le schéma de métadonnées AO.fr généré par HAL inclut des informations permettant de faire le lien sur les Systèmes Locaux qui référencent une publication (voir ci-dessous).

Les règles de bonne pratique proposées aux déposants pour favoriser cette situation normale sont les suivantes :

  1. Pour chaque publication, les co-auteurs devraient se mettre d’accord pour confier les opérations de dépôt à une seule personne (le déposant ou contributeur).

  2. Avant de référencer une publication dans un Système Local, le déposant devrait vérifier si la publication est déjà présente dans HAL.

  3. Si la publication n’est pas présente dans HAL, le déposant devrait déposer la publication et les fichiers numériques dans HAL avant de la référencer dans un Système Local, sauf si le Système Local dispose d’une procédure assurant le dépôt simultané dans HAL et dans le Système Local (grâce aux Web Services – voir ci-dessus).

  4. Si la publication est déjà présente dans HAL, le déposant devrait recopier dans le Système Local l’identifiant de HAL et faire référence dans le Système Local aux documents numériques déjà déposés dans HAL [Annexe 3]. Le Système Local peut également indiquer à HAL l’identifiant unique qu’il utilise de sorte que HAL expose cette information dans le format AO.fr (voir ci-dessous, ainsi que l’Annexe 9).

Principales situations d’usage

Cas 1 : Une publication est présente dans HAL mais pas dans le Système Local


  1. Le Système Local devrait récupérer les métadonnées de HAL (au format AO.fr, via le protocole OAI-PMH) pour son usage propre ; il peut également récupérer les documents numériques.

  2. Le Système Local devrait récupérer et stocker l’identifiant de HAL. Il doit se servir de cet identifiant pour faire référence à la publication dans HAL, en particulier dans les métadonnées qu’il expose à d’autres services et dans celles qu’il affiche à partir de sa base locale.

  3. Le Système Local peut créer des métadonnées supplémentaires spécifiques.

  4. Le Système Local devrait communiquer à HAL son identifiant unique en utilisant l’un des protocoles mis en place par HAL à cet effet [Annexe 8].

Cas 2 : Une publication est présente dans le Système Local mais pas dans HAL


  1. Si la publication relève du périmètre de HAL, le Système Local doit transférer le document numérique et les métadonnées dans HAL par une des méthodes d’alimentation indiquées ci-dessus. L’identifiant unique de la publication dans le Système Local devrait être transféré dans HAL à cette occasion.

  2. Le Système Local devrait alors récupérer et stocker l’identifiant unique de HAL, qui lui est fourni en retour du dépôt.

Cas 3 : Une publication est présente à la fois dans le Système Local et dans HAL


  1. Le Système Local devrait récupérer et stocker l’identifiant unique de HAL, par exemple en utilisant le protocole de moissonnage (ou une recopie directe lorsque la publication n’est pas identifiée dans le Set permettant le moissonnage).

  2. Le Système Local doit alors se servir de cet identifiant pour faire référence à la publication dans HAL, et en particulier aux documents numériques de la publication.

  3. Le Système Local devrait communiquer à HAL son identifiant unique en utilisant l’un des protocoles mis en place par HAL à cet effet [Annexe 8].

Exposition des métadonnées avec le protocole OAI-PMH

Le schéma de métadonnées AO.fr


  1. Le schéma de métadonnées AO.fr est destiné à exposer, pour chaque document présent dans HAL, un ensemble d’informations sur le document et, éventuellement, sur les Systèmes Locaux qui le référencent.

  2. Le schéma AO.fr est l’expression du tronc commun des métadonnées de HAL (tronc commun décrit dans le premier rapport d’étape au CoStrAO).

  3. Le schéma AO.fr inclut également l’ensemble des identifiants que les Systèmes Locaux auront fournis à HAL pour les documents qu’ils référencent, ce qui permettra aux utilisateurs du format AO.fr d’accéder aux métadonnées disponibles dans ces Systèmes Locaux.

  4. Chaque Système Local qui dispose d’identifiants uniques doit fournir et documenter les modalités pour accéder à ses métadonnées à partir de l’identifiant exposé dans le format AO.fr [Annexe 9].

Exposition des métadonnées par HAL avec le protocole OAI-PMH


  1. HAL expose des métadonnées selon (au moins) deux schémas : Dublin Core, avec le format oai_dc imposé par le protocole OAI-PMH, et AO.fr, avec le format oai_aofr défini pour archives-ouvertes.fr.

  2. HAL utilise des Sets conformément aux spécifications du protocole OAI-PMH. Des Sets spécifiques à chaque Système Local seront disponibles pour permettre un moissonnage sélectif par les Systèmes Locaux.

Exposition des métadonnées par les Systèmes Locaux avec le protocole OAI-PMH


  1. Si des Systèmes Locaux exposent des métadonnées de publications référencées dans HAL, par l’intermédiaire du protocole OAI-PMH, ils devraient utiliser l’identifiant de HAL et faire un lien explicite vers le document numérique stocké dans HAL [Annexe 3].

Annexes

Les annexes sont destinées à apporter un éclairage sur des points ne pouvant pas être développés dans le document de principes.

1Engagements réciproques entre un Système Local et HAL


Les principes développés dans ce document concernent des Systèmes Locaux relevant d’établissements signataires du protocole d’accord sur les archives ouvertes. Leur mise en œuvre suppose un accord explicite entre les responsables de chaque Système Local et de HAL, puisque HAL doit mémoriser et exposer dans le format AO.fr des données issues du Système Local (identifiants uniques).

L’accord devra être formalisé, pour chaque Système Local volontaire (ou chaque réseau de Systèmes Locaux), par un document décrivant les engagements réciproques des partenaires, accompagnée d’une annexe technique :



  • Les responsables du Système Local et de HAL s’engagent à respecter les principes décrits dans ce document.

  • Le Système Local s’engage à s’appuyer sur un système d’identifiants uniques correctement documenté et stable dans le temps, ainsi que sur une méthode d’accès associée (URL/identifiant par exemple).

  • HAL s’engage à stocker les identifiants internes du Système Local pour les publications communes, et à fournir des outils permettant au Système Local de les communiquer à HAL.

  • HAL s’engage à exposer dans le format AO.fr, pour les publications communes, les informations relatives aux Système Local (identifiants et liens éventuels vers le Système Local).

  • HAL s’engage à exposer à tout moment la liste complète des Systèmes Locaux concernés par l’accord et susceptibles d’être exposés dans le format AO.fr.

Le document d’engagements pourra par ailleurs expliciter des modalités particulières d’accord entre un Système Local et HAL (par exemple les choix de méthodes d’alimentation).

2Place des notices dans les Archives Ouvertes


Bien que ce sujet ne relève normalement pas de ce document, il est utile de rappeler quelques points sur la présence de notices dans les différents systèmes :

  • Une archive ouverte est avant tout destinée à mettre à disposition en libre accès des documents scientifiques en texte intégral, associés à une description minimale. Les notices non accompagnées de documents numériques n’ont normalement pas leur place dans une archive ouverte.

  • Des exceptions sont cependant possibles, notamment lorsqu’il y a une période d’embargo avant la mise en libre accès du document numérique.

  • En revanche, la présence de notices seules est tout à fait normale dans des Systèmes Locaux, en particulier lorsque leur finalité est le suivi des publications ou l’évaluation (où l’exhaustivité est recherchée).

  • Même si le système actuel HAL contient aujourd’hui des notices sans documents numériques attachés – notamment pour le CNRS et d’autres organismes ne disposant pas de Systèmes Locaux – seuls les documents en texte intégral constituent à proprement parler l’archive ouverte commune et seules les notices correspondantes sont exposées avec le protocole OAI-PMH.

  • Les établissements disposant d’un Système Local ne devraient normalement pas déposer dans HAL des notices seules, sans document en texte intégral.

3Référencement d’un document de HAL dans un Système Local – Citation des documents numériques de l’Archive Ouverte


Le référencement simultané d’une publication dans HAL et dans un ou plusieurs Systèmes Locaux risque de provoquer une multiplication de versions numériques de documents identiques, avec des URL différentes.

La règle proposée pour éviter cette multiplication est de privilégier l’adresse URL du document dans HAL, même lorsque le document est présenté depuis un Système Local. L’adresse à utiliser est l’URL indiquée dans la page de présentation de chaque publication (qui contient les liens vers les fichiers et les versions éventuelles), sous la forme :



http://hal.archives-ouvertes.fr/hal-00000001

http://www.hal.inserm.fr/inserm-00149855

ou http://halshs.archives-ouvertes.fr/halshs-00149992

En revanche, il ne faut pas diffuser ou citer les URL directes des fichiers stockés dans HAL.

4Les Web services actuellement mis en œuvre par HAL


L’interconnexion entre HAL et d’autres applications informatiques, comme par exemple les Systèmes Locaux, utilise des Web services fondés sur le protocole SOAP. HAL défini ainsi un certain nombre de méthodes qui vont permettre à un système informatique de réaliser des opérations similaires à celles que fait un contributeur lorsqu’il utilise l’application HAL au travers de son portail Web.

Les méthodes principales découlent directement d’un dépôt fournissant des données qualifiées à l’aide des référentiels obligatoires utilisés dans le modèle de données de HAL :



  • Le service Web « hal.archives-ouvertes.fr/ws/ref.php » permet de télécharger les référentiels comme par exemple celui des laboratoires et établissements qui va servir aux affiliations des auteurs, celui des disciplines scientifiques pour le classement de l’article, ou encore celui des journaux pour les références de publication. Cette méthode permet aussi de connaître les méta données spécifiques d’une instance particulière de HAL ou d’une thématique scientifique qui aurait des métadonnées spécifiques.

  • Le service Web « hal.archives-ouvertes.fr/ws/submit.php » permet de déposer un article, de modifier les méta données d’un article existant ou d’en déposer une nouvelle version. Il faut noter que le contributeur du dépôt est le Système local lui-même, mais un paramètre obligatoire supplémentaire permet d’identifier le contributeur réel sur le Système Local. Ce service permet de réaliser toutes les fonctions applicables à un dépôt comme par exemple l’attribution d’un article à une collection spécifique.

  • Le service Web « hal.archives-ouvertes.fr/ws/search.php » permet d’effectuer une recherche dans la base et pourrait être utilisé par exemple pour vérifier que le document que l’on s’apprête à insérer dans la base ne s’y trouve pas déjà.

La documentation sur les Web service de HAL est disponible sur le site du CCSD à l’URL http://www.ccsd.cnrs.fr/IMG/pdf/webServices.pdf

Les Systèmes Locaux qui utilisent ces Web services pour des dépôts simultanées dans leur système et dans HAL devraient fournir un Web service (nom de la méthode à définir) permettant à HAL de mettre à jour le statut du dépôt, après vérification scientifique et technique (article accepté, à modifier ou refusé). Ce WS demande en entrée un mot de passe, l’identifiant et la version de la publication dans HAL, le statut (accept, update, delete) et le motif (si modification ou refus). Un code retour (à définir) permet à HAL de s’assurer que la mise à jour a pu être effectuée.

5Protocole de mise à disposition de métadonnées d’un Système Local pour des saisies assistées dans HAL


On parle dans ce document de saisie assistée lorsque la saisie des données se fait directement dans l’un des portails de dépôt de HAL et qu’un dispositif permet de pré-remplir certains champs de saisie par les données issues d’une base de données externe ou d’un Système Local. Il s’agit d’un service visant à faciliter la tâche de celui qui dépose, mais tout se passe comme si le déposant avait saisi lui-même ces données, qu’il peut compléter et adapter, si nécessaire.

HAL permet déjà une saisie assistée en s’appuyant sur des bases internationales comme ArXiv, Pubmed, ADS ou des Systèmes Locaux comme celui de l’IRD

Lorsqu’un Système Local dispose de notices pour des publications susceptibles d’être déposées dans HAL par un chercheur, HAL peut mettre en œuvre une saisie assistée à partir de ces notices dans les conditions suivantes :


  • HAL propose, dans l’interface de dépôt associée au Système Local, un champ particulier dans lequel le déposant peut indiquer l’identifiant unique de la notice dans le Système Local.

  • Le Système Local doit rendre accessible à HAL ses notices au format AO.fr, en proposant une URL permettant à HAL de lire la notice AO.fr pour un identifiant donné.

  • HAL pourra ainsi pré-remplir les champs du formulaire en cours de saisie et permettre la prise en compte des données issues du Système Local. L’identifiant unique de la notice sera mémorisé par HAL ; c’est par son intermédiaire que le Système Local pourra retrouver le document numérique déposé dans HAL et procéder à la synchronisation éventuelle de ses données avec celles de HAL.

Exemple : Ce dispositif est dès à présent utilisé dans l’interface de dépôt HAL-IRD, qui récupère les notices référencées dans la base Horizon / Pleins textes de l’IRD (mais ce n’est pas encore le format AO.fr qui est utilisé…).

6Identifiants de documents et de versions dans HAL


HAL gère plusieurs sortes d’objets reliés entre eux par des relations de dépendance : notices, références de publications, fichiers, versions…

Pour éviter la confusion lors des échanges avec l’extérieur, HAL met en avant une unité documentaire représentant un document, à laquelle est attribué un identifiant unique ; les autres objets liés ne sont accessibles qu’à travers de cette unité documentaire.

Unité documentaire de HAL :

Les versions successives d’un même article composées chacune



HAL attribue à chaque unité documentaire un identifiant unique formé d’un préfixe dépendant de l’interface ayant servi au premier dépôt et d’un suffixe composé d’un série de chiffres. Par exemple : hal-00150206 ; inserm-00149855 ; halshs-00149992 ; ird-00142202.

7Recommandations pour les identifiants uniques de Systèmes Locaux


Le modèle d’interopérabilité entre un Système Local et HAL repose sur l’existence d’identifiants uniques pouvant être échangés entre les systèmes. Ces identifiants uniques concernent les objets pouvant figurer à la fois dans HAL et dans un Système Local, c’est-à-dire les unités documentaires décrites dans l’annexe précédente.

Un Système Local doit donc garantir qu’il gère un système d’identifiants uniques pour ses unités documentaires. On distinguera ici deux types d’identifiants :



  1. des identifiants internes dont le système doit garantir l’unicité au sein de la base locale, ainsi que la pérennité et la stabilité dans le temps ;

Chaque système est responsable du type de codage et de la méthode garantissant l’unicité des identifiants internes. Il est recommandé d’utiliser un système de codage simple et indépendant des outils informatiques utilisés, pour assurer la pérennité en cas de changement d’outils.

  1. des identifiants externes, permettant de communiquer de manière non ambiguë à l’extérieur du système, et garantissant l’unicité au niveau de l’ensemble des Systèmes Locaux concernés.

Il est recommandé de construire les identifiants externes à partir :

  • d’une partie fixe codant de manière non ambiguë l’organisme, et éventuellement la base concernée au sein de cet organisme ; une bonne méthode consiste à dériver cette partie fixe d’un identifiant unique de l’organisme, par exemple du nom de domaine attribué à l’organisme (xxx.fr) ;

  • d’une partie variable composée par l’identifiant interne.

Par exemple ird.fr/787332. Ainsi un simple alias comme ‘ao’ sur le serveur OAI du Système Local donnerait de façon explicite sans aucun mécanisme l’accès aux métadonnées du document (http://ao.ird.fr/787332)

Exemples de schémas d’identifiants uniques dont on peut s’inspirer :



  • des URI sous forme d’URL (comme le fait déjà HAL) ;

  • le schéma d’URI « info », déjà utilisé par arXiv, PubMed, le DOI, etc.

Voir le site : http://info-uri.info/ (proposition de Muriel Foulonneau qu’il faudra étudier en détails).

8Protocole de transfert d’un identifiant unique depuis un Système Local vers HAL


Chaque Système Local devra développer un Web service client fournissant principalement à HAL le couple identifiant_HAL/identifiant_local. Le service associé côté HAL, à réception de ces 2 paramètres, effectuera une mise à jour de l’enregistrement correspondant.

9Recommandations pour rendre accessibles les métadonnées des Systèmes Locaux


Le format de métadonnées AO.fr est conçu pour donner accès à la fois aux données partagées du tronc commun, stockées dans HAL, et aux données spécifiques des Systèmes Locaux. Le format AO.fr n’expose pas directement les métadonnées des Systèmes Locaux mais contient des identifiants uniques de ces systèmes, permettant d’y accéder indirectement. Il peut ainsi être généré par HAL qui ne mémorise, pour chaque Système Local, que les identifiants uniques des documents communs.

Il est donc recommandé que chaque Système Local dispose de mécanismes propres, correctement documentés, pour rendre ces métadonnées accessibles à partir des identifiants stockés dans HAL et exposés dans le format AO.fr. Il est par exemple souhaitable que le Système Local propose pour chaque document une URL pouvant être calculée à partir de l’identifiant unique interne propre au système, et que cette URL pointe sur une notice du document dans le Système Local. Ces URL doivent être stables et devraient être les plus simples possibles.

Exemples :


  1. Le système Horizon / Pleins textes de l’IRD attribue à chaque publication du fonds documentaire IRD (FDI) un numéro d’inventaire sous la forme fdi:xxxxxxxx (par exemple fdi:010011026). Chaque notice d’un document du FDI dispose d’une URL calculée à partir de ce numéro d’inventaire, sous la forme :

http://www.documentation.ird.fr/fdi/notice.php?ninv=

par exemple : http://www.documentation.ird.fr/fdi/notice.php?ninv=fdi:010011026, qui donne accès à la notice complète du document, en HTML.

D’autres URL peuvent être construites sur le même principe :

http://www.documentation.ird.fr/fdi/noticehal.php?ninv=fdi:010011026, qui retourne une notice structurée en XML ;

http://www.documentation.ird.fr/fdi/noticeoa.fr.php?ninv=fdi:010011026, qui retourne(ra) la notice au format AO.fr pour permettre la saisie assistée depuis l’interface HAL-IRD (voir l’annexe 5).


  1. Le système ProdINRA de l’Inra attribue également un identifiant unique à chaque publication, par exemple : PROD200731c8ca99.

La notice correspondante à cette publication est accessible par l’URL :

http://www.inra.fr/prodinra/pinra/doc.xsp?id=PROD200731c8ca99 (à confirmer par l’Inra).

  1. Dans la Base des productions scientifiques de l'Université de Franche-Comté, les notices ont des URL de la forme : http://bu.univ-fcomte.fr/SLHS/GEO/_159776_4.html

Il est conseillé de choisir, lorsque c’est possible, des URL indépendantes de la technologie et des langages utilisés sur le serveur. Par exemple, on préfèrera :

http://www.organisme.fr/baselocale/00143762

plutôt que :



http://www.organisme.fr/baselocale/script.php?id=00143762

1 http://www.ietf.org/rfc/rfc2119.txt

2 Les justifications de cette règle sont rappelées dans le document ManuHAL, aux paragraphes 1 et 8 :
http://www.ccsd.cnrs.fr/spip.php?rubrique12

3 Pour les documents non publiés : voir le texte fondateur, dans la partie 4 (Assurer la qualité scientifique du contenu) : http://www.archives-ouvertes.fr/spip.php?article6

4 Le tronc commun de métadonnées doit pouvoir être rempli directement par les chercheurs qui déposent des documents. Les métadonnées sont donc relativement simples et ne nécessitent pas de connaissance particulière sur les standards documentaires. Le vocabulaire utilisé est proche de celui des chercheurs.

5 http://www.revues.org/cost/images/3/3c/CoST-GR2-rapport1-v1.doc

6 Saisie assistée : saisie dans l’un des portails de dépôt de HAL à l’aide d’un dispositif permettant de pré-remplir, en fournissant un identifiant, certains champs de saisie par les données issues d’une base de données externe ou d’un Système Local.

7 PubMed, en particulier.

8 Voir le protocole OAI-PMH : http://www.openarchives.org/.
Les sets permettent au fournisseur de contenu de regrouper les ressources dans des sous-ensembles, afin de permettre un moissonnage sélectif (http://www.openarchives.org/OAI/openarchivesprotocol.html#Set)

9 De façon plus précise, l’URL du document référence l’unité abritant les différentes versions successives, chacune d’elle étant composée d’une notice et de un ou plusieurs fichiers.

CoST – GR 2 et 5 – Sous-groupe métadonnées version 1.0 29 octobre 2007 – /

Yüklə 72,08 Kb.

Dostları ilə paylaş:




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin