CoST – GR5 – Groupe Système d’information « archives ouvertes »
Compte rendu de réunion
1er février 2007
Version
|
Date
|
Statut
|
Auteurs / Contributeurs
|
Commentaires
|
0.0
|
2007-01-30
|
travail
|
Christine Boucquiaux
|
Compte rendu de la réunion
|
0.1
|
2007-01-31
|
travail
|
Odile Hologne
|
Version soumise au groupe de travail.
|
1
|
2007-02-19
|
finale
|
groupe
|
Version validée lors de la réunion du 14 février
|
RéuNIon du 25 janvier 2007
Participants
Odile Hologne : INRA (organisateur - animation de la réunion)
Daniel Charnay : CCSD
Christine Boucquiaux : AMUE
Dominique Cavet IRD
Thierry Bedouin Rennes 1
Monique Joly : INSA Lyon
Jean Louis Sourouille : INSA Lyon
Emmanuelle Janes Ober : Cemagref
Francis André : MEN-DGRI
Marie Thérèse Rebat : MEN - DGES
Jean-François Lutz : SCD – Université Metz
OBJECTIF DE LA REUNION
Les supports projetés lors de la réunion sont disponibles sur le Wiki.
ATTENTES DU COSTRA
-
produire un document de cadrage sur la problématique « SI –Archives ouvertes »
-
réaliser un (ou des) démonstrateur(s) associé à Hal et aux SI d’établissements
CONSENSUS DEGAGES
3 modèles sont identifiés :
-
le modèle « full » HAL
-
l’entrée se fait par le portail HAL
-
la publication est directement déposée dans HAL
-
aucune information n’est stockée en local
L’organisme possède un « tampon » et 1 portail dans HAL
-
le modèle « partenaire »
-
le SI local est interconnecté avec HAL
-
l’entrée se fait par le SI local
-
le chercheur saisit les métadonnées transmises par HAL et complète les métadonnées de son SI local, il ne connaît que l’interface utilisateur de son SI local
-
le full text est renvoyé à Hal ou reste stocké en local (ou les deux ?)
-
modèle : MISHA, Strasbourg – progiciel Flora d’EVER
ou
-
modèle hybride
-
l’entrée se fait par le portail HAL
-
la publication est directement déposée dans HAL
-
la publication est transférée dans le système local (selon le choix de l’établissement)
-
Les chercheurs saisissent dans HAL les publications scientifiques et dans le système local, les autres publications
-
Le système local récupère les métadonnées et/ou les fichiers de HAL
Des pré requis à prendre en compte
Sur la question des processus
-
préciser le processus de validation scientifique : validation déléguée dans les établissement ? validation nationalethématique ? selon quels critères ?
-
préciser la problématique des UMR (mixité des publications, mixité des structures…) – dans quelle(s) application(s) les chercheurs déposent-ils leurs publi ?
-
examiner les aspects d’ordre juridique (formaliser sur le plan juridique la question du transfert du SI local vers AO)
Sur les référentiels (modèles 2 et 3) :
-
définir les référentiels partagés (structure et discipline principalement) et les référentiels locaux
-
Autres référentiels : journaux, types de documents
Sur les métadonnées (modèles 2 et 3) :
-
rechercher le plus petit dénominateur commun
Sur la partie technologies :
-
publier un format d’échanges pour l’interopérabilité globale (du SI vers Hal ; des SI entre eux cf PRES…)
-
SOAP WSDL (protocole d’échanges)
ou
-
OAI PMH (OAI-AO.fr = une version riche du modèle de données, en plus du Dublin Core non qualifié – standard de base de l’OAI)
-
publier un schéma XML commun de modèles de données
Sur les identifiants
-
proposer un identifiant unique
-
Id.AO
-
Id.SI ***
-
autres Id
POINTS DE DISCUSSION
Périmètre de l’archive ouverte
-
HAL reçoit les documents scientifiques soumis ou allant – ou pouvant être - soumis à des éditeurs.
-
le périmètre du SI est plus large et contient des rapports, des cours…
Répertoire unique des unités de recherche
-
préciser qui sera opérateur du répertoire ? qui sera responsable des mises à jour (des référentiels ???) : DEPP ?
-
définir l’usage de la nomenclature thématique (pilotage ? évaluation ?...) ; cette nomenclature aura-telle de l’intérêt pour la visibilité internationale ? nécessitera-t-elle un mapping avec des nomenclatures mondiales ? qui moissonnera qui ?
-
est ce le système local qui met à jour le système national ? sur la base de quel mapping ?
Référentiel disciplinaire de HAL
-
il a une importance relative et doit rester simple et au plus prêt des chercheurs. Qualifier « importance relative » : quel est le véritable rôle du référentiel de discipline ? Dans HAL, les disciplines servent à faire un repérage « grossier » des thématiques de l’archives dans l’IHM ou dans les set OAI. Les fonctionnalités de recherche se font via des termes, mots – clés …
-
prévoir qu’il puisse échanger avec les référentiels présents dans les archives européennes
-
Pubmed et Arxiv propose une classification parfaitement reconnue par les chercheurs
-
il y aura forcement un recouvrement entre le référentiel des disciplines du répertoire unique (très macro) et celui des AO institutionnelles (+ détaillé)
-
il n’existera pas qu’un seul référentiel :
-
le niveau macro (utilisé par Hal) sera identique pour tous (ex : les 7 disciplines proposées par l’OST) – vision hiérarchique du référentiel
-
le niveau infra sera propre aux établissements
-
importance de définir la structure qui va gérer et avoir la maitrise du référentiel des disciplines
-
doit-il converger vers un référentiel international tel Frascati ?
Les différents modèles identifiés
SI client de HAL
-
le SI récupère le full text par moissonnage OAI PMH ou flux RSS ou Web services
-
nécessité sur OAI PMH de définir un format commun riche « OAI-OA.fr »
-
intégration d’un miroir de Hal dans le SI local
SI partenaire de HAL (l’utilisateur alimente le SI local et transmet ensuite les informations à HAL)
-
les établissements souhaitent conserver la maitrise des informations présentes dans leur système
-
les projets de GED se développent fortement dans les établissements
-
ne pas sous estimer la vision cible : GRAAL + GED (avec Full texte dans archive locale)
SI médiateur vers HAL (l’utilisateur se connecte au SI de l’établissement pour déposer dans HAL)
-
les données transitent d’un système à l’autre :
-
la saisie s’effectue au niveau du SI local
-
les informations ne sont pas stockées dans le SI local mais sont transférées dans HAL
-
cette étape ne peut être que transitoire dans la mesure où les établissements disposeront demain de leur propre archive locale
-
la technologie la plus adaptée est le Web services (cf GED Flora)
Processus de validation scientifique et de mise à jour
-
aujourd’hui, la validation scientifique s’effectue de façon sommaire par branches disciplinaires au niveau de HAL
-
besoin de clarifier les responsabilités en matière de validation des contenus scientifiques et de mise à jour de nouvelles versions
-
ne pas reconstruire un système de validation des publications scientifiques que les chercheurs ne souhaitent pas
-
ne pas faire jouer à la plate forme nationale le rôle de l’éditeur
-
ne pas véhiculer l’idée que la plate forme nationale récupère les publications rejetées par les éditeurs classiques
-
ne pas raisonner qu’à partir du modèle Arxiv et bien prendre en compte les variantes entre les différents processus de publications disciplinaires
-
qui est maitrise d’ouvrage pour la définition de telles procédures :
-
les chercheurs (seuls les documents qui ont passé le filtre de la validation par les pères pairs peuvent être accueillis dans l’archive nationale ?) COSTRA ?
-
mettre en place au niveau national un collège de validation (l’AO portera-t-elle dans ce cas la responsabilité de la validation scientifique de toutes les autres archives locales ?)
-
définir au niveau local une politique d’établissement relative à la validation des données sortantes du SI local vers l’archive nationale
-
n’accepter dans l’archive nationale que les documents validés dans le cadre de processus éditoriaux classiques (cas de l’INSERM) ?
-
3 niveaux d’acteurs interviennent dans le processus :
-
international : Arxiv
-
national : archives ouvertes/HAL
-
local : SI de gestion
-
le niveau international doit être régi au niveau national (surtout pas au niveau local)
exemples de processus avec ArXiv :
Aujourd’hui :
-
HAL envoie les données à Arxiv
-
Arxiv renvoie les données à Hal en cas d’erreur (fichier Texk ?)
-
Hal traite l’erreur manuellement puis redistribue les données à Arxiv (qui revalide l’ensemble) également à l’utilisateur local qu’il connaît directement
Demain :
-
comment gérer le retour, non plus directement vers l’ utilisateur local mais vers le SI : quels processus ? quelle validation ? quel liens ?
Autre situation :
-
le SI local valide un document déposé par un utilisateur
-
le SI local envoie le document à Hal : Hal ne valide pas le document
-
que se passet-t-il ?
-
qui est responsable des procédures de validation : l’établissement ? le CCSD ? l’archive internationale ?
Nature des échanges
-
privilégier le synchrone ou l’asynchrone ?
Prise en compte de la problématique des UMR
Décisions prises
1. Produire un document de synthèse sur les principales recommandations en matière d’interopérabilité SI local/archives ouvertes (prendre appui sur les pré requis indentifiés)
2. Etudier la faisabilité d’un démonstrateur entre un SI d'établissement et l'Archive Ouverte
-
identifier un ou (des) établissement(s) volontaire(s) pour spécifier une première brique
-
solliciter un financement de la part du Ministère
3. Prochaine réunion les 12 ou 13 ou 14 février en visio depuis l’AMUE ou l’INRA
-
objectif : approfondissement des processus sur la base d’exemples concrets
************
AMUE –Mission Système d’Information-
COST-G5 - SI local/archives ouvertes-25 janvier 2007
Dostları ilə paylaş: |