CoST – GR2 – réunion du 16 janvier 2007
Liste des participants
Agnès Raymond-Denise (Institut Pasteur), Christine Berthaud (ISH/CNRS), Martine Pochard (SDC de Franche Comté), Carole Giansily (Cemagref), Thierry Bedouin (Université Rennes 1), Yann Nicolas (Abes), Danièle Duclos-Faure (SDBIS DGES), Marie-Thèrèse Rebat (DGES), Monique Joly (Insa Lyon), Brigitte Prudhomme (Insa Lyon), Jean-François Lutz (Université Paul Verlaine de Metz), Daniel Charnay (CCSD), Anne-Sophie Archambeau (IRD), Dominique Cavet (IRD).
La réunion a été consacrée à l’analyse du projet de rapport pour le CoStra. Ce compte rendu se contente de lister les différents points abordés. Une version aménagée du projet de rapport au CoStra sera proposée par ailleurs.
Première partie du document (partie 1.2) Evaluation
Confirmation par le CoStra du fait que l’évaluation ne fait pas partie des objectifs de HAL.
Besoin des établissements : suivi des publications pour des usages internes, y compris pour l’évaluation.
Il y a une nécessité, dans les établissements, d’outils spécifiques pour ce suivi, HAL pouvant être un élément qui concourt au dispositif.
Affirmer ce point de manière plus explicite dans le rapport.
Affiliations
Ce point devra donner lieu à des travaux ultérieurs du sous-groupe ; proposition à rappeler dans le rapport.
Il y a un travail en cours pour modéliser et constituer un référentiel des universités et des organismes de recherche ; il convient de prendre contact avec l’AMUE (Christian Michau) pour faire valoir les besoins pour les archives ouvertes et vérifier que ce référentiel pourra être utilisé pour HAL.
Un travail est également en cours à l’OST sur la normalisation des adresses des publications. Ce qu’on en sait aujourd’hui : il ne s’agit pas d’un autre référentiel mais de recommandations sur l’écriture des adresses d’affiliations dans les publications, visant à améliorer la manière dont elles seront référencées dans le Web of Science, base de l’ISI servant à la bibliométrie et à l’établissement des indicateurs.
Le groupe souhaite que ce référentiel et ces recommandations puissent être mis en œuvre dans HAL ; les Archives Ouvertes peuvent être un moyen de faire de la pédagogie sur la normalisation des affiliations.
Par ailleurs, il existe déjà des fichiers d’autorités, utilisés en particulier dans le contexte des bibliothèques universitaires, qui constituent des éléments de référentiels tout à fait importants.
Modèle de dépôt des publications
Cas du dépôt direct dans les SI d’établissement, avec un reversement dans HAL : ajouter dans les exemples l’outil Flora développé pour la MISHA Alsace et l’outil ORI (développé dans le cadre des UNT par l’université Rennes 1, l’université de Valenciennes, l’INSA de Lyon et l’INP de Toulouse). Débat autour du cas de Graal qui n’est pas perçu par certains comme un outil de dépôt de publication (voir cependant le document déposé sur le Wiki par Daniel Charnay : http://www.revues.org/cost/images/d/d4/HAL_ENT_Graal_V1.1.2.doc). Daniel Charnay indique que dans le projet interconnexion des ENT avec HAL, c'est la brique ORI qui sera utilisée et qui sera fédératrice des différents ENT ; Graal serait une autre alternative.
Exemple en cours de développement pour l’IRD où le dépôt des documents se fera directement dans HAL, avec une récupération automatique des métadonnées déjà présentes dans le système documentaire de l’IRD, transparente pour le chercheur. Cet exemple pourrait être facilement transposé à d’autres situations.
Des questions liées à la nécessaire articulation entre les systèmes locaux et l’archive ouverte HAL ont été soulevées à plusieurs reprises dans la réunion : formats d’échanges entre les archives institutionnelles et HAL, système d’identification unique des archives ouvertes, articulation entre les identifications uniques des différents systèmes. Ce sont des sujets transversaux à ce sous-groupe de travail sur les métadonnées et à d’autres sous groupe du CoST.
Concernant les modèles possibles d’échanges de données entre les systèmes, un désaccord est apparu en fin de réunion sur l’éventualité que les systèmes locaux soient moissonnés par HAL. Alors que cette solution est proposée, en particulier par Thierry Bédouin, Daniel Charnay précise qu’il n’est pas envisagé de moissonnage de bases externes par HAL, en particulier pour préserver la qualité de la base.
Cadre de travail retenu (partie 1.3)
Deux points à ajouter :
-
Périmètre des publications pouvant être déposées dans HAL : document de niveau scientifique suffisant pour être soumis au comité de lecture d’une revue scientifique.
-
Nécessité de proposer un modèle d’échange de données entre les systèmes d’informations locaux des établissements et HAL (en relation avec le sous-groupe concerné du CoST).
Second partie du document : travaux sur les métadonnées Comment valider ? Que faut-il valider ?
Ajouter un troisième point : vérifier la compatibilité et la conformité avec les standards internationaux.
Besoins exprimés
Possibilité d’avoir éventuellement plusieurs niveaux de métadonnées, remplies par les chercheurs et/ou complétées par des documentalistes. Large débat sur cette idée, qu’il n’est peut-être pas nécessaire de retenir au final.
En revanche, nécessité de récupérer depuis des systèmes d’information locaux des métadonnées qui peuvent être plus riches que celles de HAL, ou dont la qualité documentaire peut être mieux garantie (saisie et contrôle par des documentalistes vs saisie par les chercheurs).
Comment garder la trace dans HAL de la provenance des métadonnées et éventuellement de leur niveau de « qualité » ?
Types de publications
La liste des types de publications est maintenant la même pour HAL et HAL-SHS. Le document sera corrigé en conséquence.
Tableau des métadonnées de HAL (annexe 1) Langue du document
Se conformer à la norme ISO. Prendre plutôt en standard le code sur 2 lettres et, à défaut, le code sur 3 lettres.
Année de rédaction
Attention : dans HAL il s’agit d’un champ de gestion ayant une signification particulière pour éviter la diffusion dans les systèmes d’alerte.
En fait l’année de rédaction est :
- pour les publications éditées, la date de publication figurant dans les métadonnées de catalogage ;
- pour les publications non éditées (pré-print ;o) ), l’année déduite de la date du dépôt, à moins que ce champ Année de rédaction ait été rempli.
Il est proposé de procéder plutôt de la manière suivante :
-
rendre systématique la saisie d’une année de rédaction, pour les documents non édités ;
-
mettre une case à cocher pour demander de ne pas diffuser dans les systèmes d’alerte.
Discussion sur l’équivalence en Dublin Core : le qualificatif dc.date.create, qui ne convient pas tout à fait actuellement, serait bien adapté dans ce cas (Date of creation of the resource).
Sous-titre
Proposition : s’aligner sur le standard HAL-SHS et toujours proposer le champs sous-titre.
Désaccord sur l’interprétation faite de ce champs en Dublin Core : dc.title.alternative est destiné à d’autres formes de titres (titre parallèle, titre traduit, titre abrégé… Any form of the title used as a substitute or alternative to the formal title of the resource). Quand il y a un sous-titre l’usage courant consiste plutôt à le mettre dans dc.title, à la suite du titre (séparé par : ).
Résumés
Difficultés liées à la langue. Une solution pourrait consister à qualifier cette information par la langue (langue du résumé), quand cette information est connue.
Les systèmes actuels ne sont pas structurés de cette manière : pour HAL, résumé obligatoire en anglais et résumé facultatif dans une autre langue ; pour HAL-SHS, résumé obligatoire dans la langue du document et résumé facultatif dans une autre langue. Dans les échanges de données, il faut éviter d’introduire des erreurs ou des incompatibilités du fait de ces différences de règles…
Mots clés
Même difficulté liée à la langue. Risque d’incohérence au niveau de l’archive alors que les systèmes « locaux » sont en général cohérents (mots clés tous en français ou tous en anglais…).
Systèmes de mots clés et classifications
Large débat sur la possibilité de mémoriser ces informations dans HAL sans en perdre la substance, c’est-à-dire en les qualifiant.
Deux points de vue contradictoires :
-
il est intéressant de stocker dans HAL des métadonnées d’indexation (mots clés, classification) qui seraient issues d’autres systèmes d’information et dont on pourrait garantir la qualité ; cela permet en particulier de mettre en œuvre des outils de recherche plus évolués ;
-
il est très risqué de vouloir mélanger dans HAL des mots clés ou des classifications provenant de systèmes très différents et couvrant une palette très large de disciplines ; le résultat ne pourra pas être homogène et on risque d’obtenir un effet inverse de ce qui est recherché : mauvaise qualité des recherches, silence…
Aujourd’hui, il n’y a pas de consensus sur ce sujet et le groupe ne peut pas se prononcer sur des recommandations concernant les mots clés et les classifications dans l’archive commune HAL.
CoST – GR2 – Sous-groupe métadonnées Réunion du 16 janvier 2007 /
Dostları ilə paylaş: |