Accomplissements en sciences de la vie Vincent Breton, cnrs-in2P3, lpc clermont-Ferrand
tarix 01.08.2018 ölçüsü 445 b. #64744
Vincent Breton, CNRS-IN2P3, LPC Clermont-Ferrand Credit: C. Germain, D. Kim, J. Montagnat, J. Salzemann, Y-T Wu
Introduction Panorama des progrès accomplis dans l’utilisation des grilles de production Exemples en bioinformatique, imagerie médicale et recherche de nouveaux médicaments Perspectives Rôle des futures infrastructures de production Besoin de collaborations entre chercheurs en informatique et utilisateurs de la grille en sciences du vivant Conclusion
Enjeux et intérêt des grilles en sciences du vivant Les enjeux L’avalanche des données a bouleversé les stratégies de recherche en biologie moléculaire La médecine doit évoluer vers une science exacte exploitant toutes les données de la génomique à l’épidémiologie L’apport des grilles La grille fournit aujourd’hui les siècles de cycles CPU requis pour les calculs massifs La grille fournit aujourd’hui les services de gestion sécurisée pour stocker et copier les données biologiques et médicales La grille offrira à terme l’environnement collaboratif pour l’intégration et le partage des données dans les communautés de recherche
Comment utilise-t-on les grilles aujourd’hui en sciences du vivant ? Pour déployer des calculs à très grande échelle Exemple en bioinformatique: raffinement des structures de la PDB (Embrace – EGEE, LPC Clermont-Fd) Exemple en imagerie médicale: MRI simulator (EGEE, CREATIS) Exemple pour la recherche de nouveaux médicaments: WISDOM (AuverGrid – EGEE – BioinfoGRID, LPC Clermont-Fd) Pour l’analyse interactive de données de plus en plus volumineuses Exemple en bioinformatique: portail GPS@ (EGEE, IBCP) Exemple en Imagerie médicale: GPTM3D (AGIR – EGEE, LRI - LAL) Pour mutualiser de nouveaux services et compétences Exemple en bioinformatique à l’échelle régionale: LifeGrid (AuverGrid) Exemple en imagerie médicale: Bronze Standard (AGIR – EGEE, I3S) Exemple pour la recherche de nouveaux médicaments: WISDOM (AuverGrid – EGEE, LPC Clermont-Fd)
Bioinformatics: recalculating protein 3D structures in PDB The PDB data base gathers publicly available 3D protein structures Project: redo the structures by recalculating the diffraction patterns
GPSA: Bioinformatics Grid Portal Molecular Bioinformatics of proteins Analyze data from high-throughput Biology: complete genome projects, EST, complete proteomes , structural biology, …. Integration of biological data and tools Method Provide Biologists with an usual Web interface for Bioinformatics: NPS@ NPS@ Web portal online since 1998 46 tools & 12 updated databases + 10,000,000 jobs & 5,000 jobs/day Ease the access to updated databases and algorithms. Protein databases are stored on the grid storage as flat files, encrypted if needed. Wrapping legacy bioinformatics applications Transparent remote access through local file-system accesses Display results in graphical Web interface. Status: Prototype
Système d’Information régional pour les sciences du vivant en Auvergne Objectif: utiliser la grille régionale AuverGrid pour mutualiser des ressources et services informatiques pour les sciences du vivant en Auvergne Deux thèses en cours à l’interface entre biologie, informatique et bioinformatique Ordonnancement et réplication de données (ENS Lyon, LPC) conception distribuée d'oligonucléotides pour puces à ADN (LIMOS, LBP)
MRI simulator Scientific objectives Better understand MR physics. Study MR sequences in-silico. Study MR artefacts. Validate MR Image processing algorithms on synthetic yet realistic images. Method Simulate Bloch's electromagnetism equations. Paralle (MPI)l implementation to speed-up computations.
Example: radiology analysis Scientific objectives Interactive volume reconstruction on large radiological data. PTM3D is an interactive tool for performing computer-assisted 3D segmentation and volume reconstruction and measurement (RSNA 2004) Reconstruction of complex organs (e.g. lung) or entire body from modern CT-scans is involved in augmented reality use case e.g. therapy planning. Method Starting from an hand-made rough Initialization,a snake-based algorithm segments each slice of a medical volume. 3D reconstruction is achieved in parallel by triangulating contours from consecutive slices.
Recherche de nouveaux médicaments contre la grippe aviaire Objectifs: étudier l’impact de mutations de la neuraminidase N1 sur l’efficacité des médicaments actuels (Tamiflu) Identifier de nouvelles molécules actives Méthode: Calculs sur ordinateur des probabilités d’accrochage des molécules sur la neuraminidase mutée Résultats expérimentaux 20% des 300 molécules sélectionnées in vitro et testées in vivo sont plus actives que le tamiflu Facteur 200 d’amélioration des résuttats des tests in vitro
Recherche de nouveaux médicaments contre la malaria Objectifs: Méthode: Calculs sur ordinateur des probabilités d’accrochage des molécules sur ces cibles Raffinement des calculs par dynamique moléculaire Résultats expérimentaux 20% des 30 molécules sélectionnées in vitro et testées in vivo sont des inhibiteurs actifs Tests in vivo en cours à Montpellier
WISDOM collaboration
Perspectives Les grilles seront les infrastructures informatiques des infrastructures de recherche de demain Exemple en bioinformatique: ELIXIR Exemple en biodiversité: LifeWatch Condition: offrir les services d’intégration des données Poursuivre le développement de nouveaux services adaptés Exemple: gestion sécurisée des données (AGIR – EGEE) Méthode: collaborations entre chercheurs en informatique et utilisateurs de la grille Exemple en imagerie médicale: le projet AGIR Exemple en imagerie médicale et bioinformatique: le projet GWENDIA
ELIXIR Préparer la construction d’une infrastructure pour la gestion et l’intégration d’information en science de la vie Centrée sur l’European Bioinformatics Institute Promouvant l’intégration et l’interopérabilité
Biodiversity infrastructure: the LifeWatch project Life Watch: e-Science and Technology Infrastructure for bioversity data and observatories Several thousand sites collecting data of ecological interest The challenges Distributed data generation Common mechanisms for sharing, analyzing and synthesizing these data Building a international infrastructure is easier on a grid foundation. Use case under study (EGEE – HealthGrid)
Grids are the answer provided technical challenges are overcome Distributed data integration and computing Security Performance Usability Standards Need for reference implementations of standard grid services Lack of connection between medical informatics standards and grid standards (e.g. grid-enabled DICOM) Lack of standard open source ontologies in medical informatics Grid deployment in medical research centres Easy installation of secure grid nodes Friendly user interface
The technology to build knowledge grids is not yet mature
Application level services Medical Data Manager Grid storage interface to DICOM databases Data protection Encryption (storage/network protection) + access control (privacy protection). Two existing systems: Hydra key store integrated in gLiteIO (JRA1) Perroquet (Parrot based, IBCP) Data parallel workflows Data intensive service composition-based applications Fast turn over
Grid and medical imaging Algorithm research and deployment Availability of algorithms and datasets eases the development and the validation of algorithms on shared datasets. Image guided diagnosis and augmented reality Combining the medical user expertise and the resource of the Grid in compute and data intensive tasks is a promising way to transfer experimental research to clinical practice. New grid services are required Workflows, management of sensitive DICOM data, responsivness, on-the-fly adaptive compression On a production grid Multi-disciplinary action: ACI masses de Données CNRS-STIC, CNRS-IN2P3, INRIA, INSERM, Hospitals
Some results Evaluation of registration accuracy: first real scale test of the Bronze standard The grid role: from days to hours Requires the development of a Scufl workflow enactor MOTEUR and sophisticated performance and failure models. Deployed on Grid’5000 and EGEE The Medical Data manager: transparent access to DICOM images for grid-enabled applications Security and privacy: Single sign-on, Encryption, Fine grain access control, Files metadata keys
GWENDIA: Grid Workflows GWENDIA aims at efficiently exploiting distributed grid infrastructures to tackle life sciences applications requirement through workflow enactment technologies. Scientific challenges Workflow languages expressivity Workflows scheduling Applications area Drug discovery Cardiac images analysis
Perspectives en Asie Les grilles offrent une infrastructure pour développer des collaborations Intégration des équipes asiatiques dans des grands projets internationaux (LHC) Intégration des équipes asiatiques dans des organisations virtuelles (biomédical) Nombreuses actions entreprises en 2007 Ecole sur les grilles (ACGRID, Vietnam, Nov. 2007) Participation à des Laboratoires Internationaux Associés (LIA) Chine, Corée , Japon, Vietnam Projet de système de surveillance et d’alerte pour la grippe aviaire Collaboration CNRS (IN2P3,EDD) avec des laboratoires asiatiques (Vietnam, Chine, Corée,…)
Conclusion Les sciences de la vie utilisent aujourd’hui les grilles pour leur production scientifique 1er consommateur de ressources EGEE après les expériences LHC Les ingénieurs et chercheurs français jouent un rôle moteur au niveau international Démarche pluridisciplinaire, multi-départements, en collaboration avec les autres EPST et les universités Visibilité internationale Les grilles vont être utilisées pour structurer l’espace européen de recherche en sciences de la vie Exemple en bioinformatique: ELIXIR Exemple en biodiversité: LIFEWATCH L’Institut des Grilles est essentiel pour maintenir le leadership français sur les grilles en sciences du vivant Structuration nationale Soutien en ressources humaines et fonctionnement
Dostları ilə paylaş: