Titre documentMétadonnées de catalogage – partie « référence bibliographique » pour les articles
Annexe 2 – Déroulement des travaux du groupe
Les débats sur la liste de discussion et les contributions sur le Wiki ont couvert un champ beaucoup plus large que le seul sujet des métadonnées ; ils ont été l’occasion d’aborder des problèmes de fond qui conditionnent largement le travail à effectuer. Fonction de la plate forme commune
Les réponses à ces questions conditionnent fortement les choix à faire en matière de schéma de métadonnées. Utilisation pour l’évaluationD’importants débats ont eu lieu pour savoir si le système commun serait utilisé pour l’évaluation, le décompte des publications et la production éventuelle d’indicateurs. Les demandes faites aux établissements dans le cadre de la LOLF rendent nécessaire la mise en place d’outils adaptés pour le suivi des publications : Peut-on utiliser les archives ouvertes pour le faire ? Peut-on avoir une approche globale pour tous les outils nécessaires à un établissement ? Les discussions n’ont pas abouti, dans un premier temps, à une position commune ; elles ont fait ressortir l’importance du sujet et la nécessité d’apporter une réponse claire. Cependant, il semble difficile, voire impossible, de s’appuyer uniquement sur un outil commun comme HAL pour l’évaluation et la production d’indicateurs propres aux établissements. L’existence de systèmes adaptés aux besoins de chaque organisme en matière d’évaluation et de suivi des publications est indispensable, HAL pouvant être un élément qui concourt aux dispositifs mise en place dans les établissements. La distinction Archives Ouvertes communes / Archives Institutionnelles des organismes est donc là aussi mis en évidence. AffiliationsMême si le système proposé actuellement par HAL pour enregistrer les affiliations est plus riche que ce qui existe dans les bases de données bibliographiques, il suscite de nombreuses questions et ne répond pas toujours aux attentes de chacun. Les discussions font apparaître
Une demande forte d’approfondissement du travail sur les affiliations est exprimée. Il y a un travail en cours pour modéliser et constituer un référentiel des universités, des organismes de recherche et de leurs laboratoires ou unités de recherche ; il convient de prendre contact avec l’AMUE (Christian Michau) pour faire valoir les besoins pour les archives ouvertes et vérifier que ce référentiel pourra être utilisé pour HAL. Un travail est également en cours à l’OST sur la normalisation des adresses des publications. Il ne s’agit pas de produire un autre référentiel mais de travailler avec les organismes, les éditeurs scientifique et Thomson ISI (producteur du Web of Science) pour formaliser des recommandations sur l’écriture des adresses d’affiliations dans les publications. L’objectif visé est d’améliorer la manière dont les publications seront référencées dans le Web of Science, servant à la bibliométrie et à l’établissement des indicateurs. Le groupe souhaite que ce référentiel et ces recommandations puissent être mis en œuvre dans HAL ; les Archives Ouvertes peuvent être un moyen de faire de la pédagogie sur la normalisation des affiliations. Par ailleurs, il existe déjà des fichiers d’autorités, utilisés en particulier dans le contexte des bibliothèques universitaires, qui constituent des éléments de référentiels tout à fait importants.
Systèmes d’informationLa question du positionnement des archives ouvertes par rapport aux systèmes d’information des établissements est posée ; elle concerne la plupart des signataires de l’accord. Cette question est surtout posée par ceux qui disposent déjà d’un système documentaire relatif à leurs publications, ou qui sont engagés dans la mise en place d’archives institutionnelles, d’ENT ou de systèmes d’information propres à leur établissement. Là encore, les débats ont porté sur les différents modèles possibles et sur les méthodes à mettre en œuvre : Comment faire pour intégrer les problématiques d’archives ouvertes dans un projet plus global ? Peut-on mettre en place un système unique ? Doit-on au contraire prévoir des systèmes distincts qui communiquent grâce à des procédures d’interopérabilité ? etc… Modèles pour le dépôt des publicationsLes modalités de dépôt des publications dans l’archive ouverte commune sont envisagées de manières très diverses selon les établissements :
On peut donner comme exemples l’outil Flora (développé pour la MISHA Alsace) et l’outil ORI (développé dans le cadre des UNT par l’université Rennes 1, l’université de Valenciennes, l’INSA de Lyon et l’INP de Toulouse). On peut citer également du cas de Graal qui n’est pas perçu par certains comme un outil de dépôt de publication (voir cependant le document déposé sur le Wiki : http://www.revues.org/cost/images/d/d4/HAL_ENT_Graal_V1.1.2.doc). Daniel Charnay indique que dans le projet interconnexion des ENT avec HAL, c'est la brique ORI qui sera utilisée et qui sera fédératrice des différents ENT ; Graal serait une autre alternative.
Un exemple de ce type a été développé par HAL et l’IRD pour HAL-IRD : le dépôt des documents se fait directement dans HAL, avec une récupération automatique des métadonnées déjà présentes dans le système documentaire Horizon / Pleins Textes de l’IRD, transparente pour le chercheur. Cet exemple pourrait être facilement transposé à d’autres situations.
La connaissance de toutes ces situations impose une démarche assez souple pour définir les éléments communs de métadonnées ; elle fait également apparaître la difficulté de définir un schéma de métadonnées global convenant à toutes les situations. Le problème de la gestion des doublons (publications déposées dans plusieurs systèmes du fait de la présence d’auteurs d’établissements différents) n’a été que rapidement évoqué dans les discussions mais constitue une difficulté majeure qu’il conviendra de traiter. Des questions liées à la nécessaire articulation entre les systèmes locaux et l’archive ouverte HAL ont été soulevées à plusieurs reprises : formats d’échanges entre les archives institutionnelles et HAL, système d’identification unique des archives ouvertes, articulation entre les identifications uniques des différents systèmes. Ce sont des sujets transversaux à ce sous-groupe de travail sur les métadonnées et à d’autres sous groupe du CoST. Concernant les modèles possibles d’échanges de données entre les systèmes, il n’y a pas aujourd’hui de consensus sur l’éventualité que les systèmes locaux soient moissonnés par HAL. Alors que cette solution est proposée, en particulier pour des systèmes locaux d’universités, il semble que le CCSD n’envisage par de mettre en place un moissonnage de bases externes par HAL, en particulier pour préserver la qualité de la base.
Sources d’information sur les métadonnées de HAL
Comment valider ? Que faut-il valider ?Les métadonnées de HAL peuvent apparaître sous des formes différentes selon les outils utilisés (saisie, importation, exportation OAI, extraction…). Pour valider les métadonnées de HAL, il faut donc les analyser à partir des préoccupations suivantes :
Besoins exprimés
Ces deux derniers besoins amènent à confronter les métadonnées actuelles de HAL avec les standard habituels des bases de données documentaires, et à proposer la modification ou l’ajout de certains champs à HAL, même s’ils ne sont pas directement accessibles aux chercheurs qui déposent. Il est par exemple demandé que certains champs puissent être qualifiés dans HAL (par la référence à une langue, un langage d’indexation, une classification…), de sorte que l’information présente dans d’autres systèmes puisse être répercutée dans HAL sans perte de qualité. Par ailleurs, les besoins d’interopérabilité s’expriment de manière plus symétrique que ce que propose HAL actuellement : il ne s’agit pas seulement de pourvoir entrer des données dans HAL et de les récupérer sous la forme proposée par HAL, mais de pouvoir organiser réellement des échanges entre des systèmes qui doivent coexister et gérer dans le temps des données dont certains éléments sont communs. La définition d’un format d’échange « pivot », servant à la fois aux entrées et aux sorties, permettrait d’aller plus facilement dans cette direction.
Dans HAL, le type de publication a un rôle bien particulier : il permet de déterminer quelles sont les métadonnées bibliographiques demandées lors des saisies ou des exports, et de préciser éventuellement le caractère obligatoire de la saisie. Modifications récentes de la liste des typesLa liste a été modifiée récemment dans HAL et dans HAL-SHS, qui s’appuient maintenant sur la même liste. Elle se rapproche de la liste suggérée par le ministère pour établir les listes de publications de manière standardisée.
Cas des prépublicationsLe groupe de travail propose que les prépublications figurent plus explicitement dans la liste des types de publication de l’archive ouverte commune. Ce n’est pas le cas aujourd’hui ; le terme de prépublication n’est d’ailleurs pas utilisé dans HAL. Il est simplement prévu des dépôt de publication sans référence bibliographique (et donc sans type de publication). Cela peut entraîner des incompréhensions et une difficulté à identifier le statut réel d’un document déposé dans HAL.
Par ailleurs, il est souhaitable de conserver la trace du statut de chaque version d’une publication, au moment de son dépôt. Un document peut être entré initialement comme une prépublication (sans type), puis la notice peut être enrichie (en particulier avec un vrai type) au moment où le papier est effectivement publié. Il en résulte une ambiguïté sur le statut du document initial, qui n’est pas présenté alors comme une publication. Deux pistes possibles :
Voir le tableau en annexe pour l’analyse fine des champs et du caractère obligatoire ou facultatif de certains champs. Qualification de certains champsPour prendre mieux en compte certaines informations sur la langue (résumés, titres, mots clés), sur le langage documentaire, le thésaurus ou la classification utilisé (mots clés, classifications…) ou même les identifiants utilisés (DOI, identifiants HAL, identifiant WOS, identifiant dans un autre système), il est souhaitable que HAL puisse mémoriser des métadonnées qualifiées. Cela pourrait être implémenté de manière générique, dans les formats d’entrée ou d’import, par l’ajour d’un attribut dont les valeurs possibles seraient contrôlées dans HAL, par exemple : ou
ou
Cela suppose que l’information puisse être mémorisée dans HAL, et éventuellement saisie par les documentalistes quand c’est possible. En revanche, il n’est pas forcément nécessaire que ce niveau de qualification soit proposé dans le formulaire destiné aux chercheurs. Au lieu de prévoir dans HAL plusieurs champs pour les résumés, les mots clés, les classifications ou les identifiants, on pourrait plutôt prévoir un seul champ répétable, pouvant être qualifié. Cela évitera d’avoir des demandes ultérieures de créations de nouveaux champs pour assurer la compatibilité avec des systèmes existants : il suffira de prévoir une nouvelle valeur pour la qualification de la métadonnées (exemple : introduction d’une classification issue d’un nouvel ENT).
IdentifiantsNécessité de prévoir dans HAL la possibilité de mémoriser les identifiants propres bases de données « partenaires », en cas d’échange de données entre systèmes. C’est une bonne pratique pour garantir que chacun retrouve ses données et peut faire des mises à jour fiables (en utilsiant son identifiant, par exemple). Il est également souhaité que des identifiants comme le numéro ISI dans le Web of Science puisse être mémorisé et rendu accessible. Cela pourrait être implémenté comme un champ identifiant qualifié par un code propre à chaque organisme partenaire, la liste de ces codes étant contrôlée. Exemple (réel) : Thèses et HDRTravail à poursuivre pour se rapprocher des systèmes en vigueur : STAR… Référentiels des écoles doctorales… Métadonnées de gestion et droitsDans HAL, il est actuellement prévu 4 cas pour la gestion des droits 1 : « Les fichiers que je dépose sont des fichiers auteur » 2 : « Cet éditeur fait partie de ceux qui autorisent le dépôt des "fichiers éditeur" sur une archive ouverte » 3 : « J'ai obtenu l'accord explicite de cet éditeur pour ce dépôt particulier » 4 : « Le ou les auteurs n'ont cédé par écrit aucun droit à cet éditeur » Travail à poursuivre – problème des Creative Commons réclamés par le groupe de travail Annexe 3 – Tableau des domaines disciplinairesDomaine disciplinaire HAL Equivalent dans arXiv Physique [physics] Matière Condensée [cond-mat] Electrons fortement corrélés [cond-mat.str-el] Matière Molle [cond-mat.soft] Mécanique statistique [cond-mat.stat-mech] Science des matériaux [cond-mat.mtrl-sci] Supraconductivité [cond-mat.supr-con] Systèmes désordonnés et réseaux de neurones [cond-mat.dis-nn] Systèmes mésoscopiques et effet Hall quantique [cond-mat.mes-hall] Autre [cond-mat.other] Mécanique [physics] Biomécanique [physics.med-ph] Génie mécanique [physics.class-ph] Mécanique des fluides [physics.class-ph] Mécanique des matériaux [physics.class-ph] Mécanique des structures [physics.class-ph] Mécanique des solides [physics.class-ph] Thermique [physics.class-ph] Vibrations [physics.class-ph] Matériaux et structures en mécanique [physics.class-ph] Acoustique [physics.class-ph] Physique [physics] Agrégats Moléculaires et Atomiques [physics.atm-clus] Analyse de données, Statistiques et Probabilités [physics.data-an] Biophysique [physics.bio-ph] Chimie-Physique [physics.chem-ph] Dynamique des Fluides [physics.flu-dyn] Enseignement de la physique [physics.ed-ph] Géophysique [physics.geo-ph] Histoire de la Physique [physics.hist-ph] Instrumentations et Détecteurs [physics.ins-det] Optique [physics.optics] Physique : vulgarisation [physics.pop-ph] Physique Atmosphérique et Océanique [physics.ao-ph] Physique Atomique [physics.atom-ph] Physique Classique [physics.class-ph] Physique de l'espace [physics.space-ph] Physique des accélérateurs [physics.acc-ph] Physique des plasmas [physics.plasm-ph] Physique et Société [physics.soc-ph] Physique Générale [physics.gen-ph] Physique Médicale [physics.med-ph] Physique Numérique [physics.comp-ph] Astrophysique [astro-ph] Physique des Hautes Energies - Expérience [hep-ex] Physique des Hautes Energies - Phénoménologie [hep-ph] Physique des Hautes Energies - Réseau [hep-lat] Physique des Hautes Energies - Théorie [hep-th] Physique Mathématique [math-ph] Physique Nucléaire Expérimentale [nucl-ex] Physique Nucléaire Théorique [nucl-th] Physique Quantique [quant-ph] Relativité Générale et Cosmologie Quantique [gr-qc]
Algèbre commutative [math.AC] Algèbres d'opérateurs [math.OA] Algèbres quantiques [math.QA] Analyse classique [math.CA] Analyse complexe [math.CV] Analyse fonctionnelle [math.FA] Analyse numérique [math.NA] Anneaux et algèbres [math.RA] Catégories et ensembles [math.CT] Combinatoire [math.CO] Equations aux dérivées partielles [math.AP] Géométrie algébrique [math.AG] Géométrie différentielle [math.DG] Géométrie métrique [math.MG] Géométrie symplectique [math.SG] Histoire et perspectives sur les mathématiques [math.HO] K-théorie et homologie [math.KT] Logique [math.LO] Mathématiques générales [math.GM] Optimisation et contrôle [math.OC] Physique mathématique [math.MP] Systèmes dynamiques [math.DS] Théorie des groupes [math.GR] Théorie des nombres [math.NT] Probabilités [math.PR] Théorie des représentations [math.RT] Théorie spectrale [math.SP] Topologie algébrique [math.AT] Topologie générale [math.GN] Topologie géométrique [math.GT] Statistiques [math.ST] Informatique [cs] Algorithme et structure de données [cs.DS] Analyse numérique [cs.NA] Apprentissage [cs.LG] Architecture [cs.AR] Arithmétique des ordinateurs Automatique Base de données [cs.DB] Bibliothèque électronique [cs.DL] Bio-informatique [q-bio.QM] Biotechnologie Calcul parallèle, distribué et partagé [cs.DC] Complexité [cs.CC] Cryptographie et sécurité [cs.CR] Génie logiciel [cs.SE] Géométrie algorithmique [cs.CG] Imagerie médicale Informatique et langage [cs.CL] Informatique et théorie des jeux [cs.GT] Informatique mobile Informatique ubiquitaire Ingénierie, finance et science [cs.CE] Ingénierie assistée par ordinateur Intelligence artificielle [cs.AI] Interface homme-machine [cs.HC] Langage de programmation [cs.PL] Littérature générale [cs.GL] Logiciel mathématique [cs.MS] Logique en informatique [cs.LO] Mathématique discrète [cs.DM] Modélisation et simulation Multimédia [cs.MM] Ordinateur et société [cs.CY] Performance et fiabilité [cs.PF] Recherche d'information [cs.IR] Recherche opérationnelle Réseau de neurones [cs.NE] Réseaux et télécommunications [cs.NI] Robotique [cs.RO] Son [cs.SD] Synthèse d'image et réalité virtuelle [cs.GR] Système d'exploitation [cs.OS] Systèmes embarqués Système multi-agents [cs.MA] Théorie de l'information et codage [cs.IT] Traitement des images Traitement du texte et du document Traitement du signal Vision par ordinateur et reconnaissance de formes [cs.CV] Web
Environnements Informatiques pour l'Apprentissage Humain Autre [cs.OH] Science non linéaire [nlin] Adaptation et Systèmes auto-organisés [nlin.AO] Automates cellulaires et gaz sur réseau [nlin.CG] Dynamique Chaotique [nlin.CD] Systèmes Solubles et Intégrables [nlin.SI] Formation de Structures et Solitons [nlin.PS] Chimie Chimie organique Chimie théorique et/ou physique Matériaux Chimie analytique Chimie inorganique Chimie thérapeutique Chimie de coordination Catalyse Polymères Chemo-informatique Génie chimique Autre
Anthropologie sociale et ethnologie Archéologie Anthropologie biologique Architecture, aménagement de l'espace Art et histoire de l'art Démographie Droit
Economie Education Etudes classiques Etudes de l'environnement Religions Sciences de l'information et de la communication Philosophie Psychologie Géographie Gestion
Héritage culturel et muséologie Histoire
Linguistique Littératures Méthodes et statistiques Musique, musicologie et arts de la scène Etudes sur le genre Histoire, Philosophie et Sociologie des sciences Sciences politiques Sociologie Sciences du Vivant Biochimie, Biologie Moléculaire Biochimie [q-bio.BM] Biologie moléculaire Biologie structurale [q-bio.BM] Biophysique Génomique, Transcriptomique et Protéomique [q-bio.GN] Bio-Informatique, Biologie Systémique [q-bio.QM] Biotechnologies Génétique Génétique animale Génétique des plantes Génétique des populations [q-bio.PE] Génétique humaine Biologie cellulaire Biologie de la cellule (animale, végétale,…) [q-bio.SC] Interactions cellulaires [q-bio.CB] Biologie du développement Embryologie et organogenèse Gamétogenèse Morphogenèse Biologie de la reproduction Reproduction asexuée Reproduction sexuée Microbiologie et Parasitologie Bactériologie Mycologie Parasitologie Protistologie Virologie Cancer Médecine humaine et pathologie Anatomie, Histologie, Anatomopathologie [q-bio.TO] Cardiologie et système cardiovasculaire Chirurgie Dermatologie Endocrinologie et métabolisme Gériatrie et gérontologie Gynécologie et obstétrique Hématologie Hépatologie et Gastroentérologie Maladies infectieuses Maladies émergentes Organes des sens Pédiatrie Physiologie [q-bio.TO] Pneumologie et système respiratoire Psychiatrie et santé mentale Rhumatologie et système ostéo-articulaire Urologie et Néphrologie Alimentation et Nutrition Ethique
Sciences pharmaceutiques Médicaments Pharmacie galénique Pharmacologie Immunologie Allergologie Immunité adaptative Immunité innée Immunothérapie Vaccinologie Toxicologie Ecotoxicologie Toxicologie et chaîne alimentaire Toxicologie végétale et mycotoxicologie Neurosciences [q-bio.NC] Neurobiologie Psychologie et comportements Sciences cognitives Santé publique et épidémiologie Ingénierie biomédicale Biomatériaux Imagerie
Médecine nucléaire Biologie animale Médecine vétérinaire et santé animal Zoologie des invertébrés Zoologie des vertébrés Biologie végétale Amélioration des plantes Botanique Phytopathologie et phytopharmacie Biodiversité Evolution [q-bio.PE] Systématique, phylogénie et taxonomie Ecologie, Environnement Bioclimatologie Ecosystèmes Interactions entre organismes Santé Sciences agricoles Agriculture, économie et politique Agronomie Horticulture Science des sols Science des productions animales Sciences et techniques de l'agriculture Sciences et techniques des pêches Sylviculture, foresterie Zootechnie Ingénierie des aliments Autre [q-bio.OT]
Astrophysique [astro-ph] Océan, Atmosphère Sciences de la Terre Climatologie Géochimie Géologie appliquée Géomorphologie Géophysique [physics.geo-ph] Glaciologie Hydrologie Météorologie Minéralogie Océanographie Paléontologie Pétrographie Planétologie Stratigraphie Tectonique Volcanologie Interfaces continentales, environnement Autre
Sciences de l'ingénieur Traitement du signal Automatique / Robotique Micro et nanotechnologies Electromagnétisme Optique / photonique Energie électrique Acoustique [physics.class-ph] Milieux fluides et réactifs Plasmas
Génie des procédés Mécanique Biomécanique [physics.med-ph] Génie mécanique [physics.class-ph] Mécanique des fluides [physics.class-ph] Mécanique des matériaux [physics.class-ph] Mécanique des structures [physics.class-ph] Mécanique des solides [physics.class-ph] Thermique [physics.class-ph] Vibrations [physics.class-ph] Matériaux et structures en mécanique [physics.class-ph] Autre
Sciences cognitives Informatique Linguistique Neurosciences Psychologie Sciences et Technologies de l'Information et de la Communication (supprimé) Annexe 4 – Propositions concernant les sciences de l’ingénieurDocuments eXcel adressés sur la liste de diffusion le 26.10.2006 1 Cependant, l’absence d’un autre système pour recenser les publications amène le CNRS à encourager les chercheurs à placer dans HAL des notices documentaires sans document attaché, en contradiction avec la vocation d’une archive ouverte… CoST – GR2 – Sous-groupe métadonnées Premier rapport au CoStra / Yüklə 230,25 Kb. Dostları ilə paylaş: |