FrameDP: sensitive peptide detection on noisy matured sequences
http://iant.toulouse.inra.fr/FrameDP/
Jérôme Gouzy1, Sébastien Carrere1 and Thomas Schiex2,*
1 Laboratoire Interactions Plantes Micro-organismes (LIPM) UMR441/2594, INRA/CNRS, F-31320 Castanet Tolosan, France
2 Unité de Biométrie et d’Intelligence Artificielle UR 875, INRA, F-31320 Castanet Tolosan, France
Transcriptome sequencing represents a fundamental source of information for genome wide studies and transcriptome analysis and will become increasingly important for expression analysis as new sequencing technologies takes over array technology. The identification of the protein coding region in transcript sequences is a prerequisite for systematic amino acid level analysis and more specifically for domain identification. In this paper, we present FrameDP, a self training integrative pipeline for predicting CDS in transcripts which can adapt itself to different levels of sequence qualities.
Compared to the alternative prot4EST pipeline, FrameDP has strong qualitative advantages. The most important of all is its ability to self-train directly on EST clusters instead of requiring curated cDNA sets to train the underlying ESTScan and DECODER (Fukunishi and Hayashizaki, 2001) software. Thanks to FrameD, FrameDP also directly integrates the similarity information inside the CDS prediction process instead of performing separate predictions. Beyond this, FrameDP can use multiple Markov models and can handle degenerated sequences both for signals (STOP/START codons) and inside Markov models.
The PERL-CGI server provides life scientists with a user-friendly interface to the pipeline (limited to batches of fifty sequences). It also provides an automatic protein description based on InterPro domain content. The functional annotation capabilities rely on BioMoby web services and on the REMORA workflow manager (Carrere and Gouzy, 2006).
A package for large scale local application is provided under the CECILL2 open source licence. It includes FrameD, NCBI-BlastX and paraloop. The pipeline is controlled by a single program, configurable using one configuration file.
14 citations dans google scholar; 9 citations dans le WOS.
iANT : integrated ANnotation Tool -
http://iant.toulouse.inra.fr/S.meliloti; http://iant.toulouse.inra.fr/R.solanacearum; http://iant.toulouse.inra.fr/X.species
Objectifs :
Depuis 1998, la plateforme bioinformatique du Laboratoire des Interactions Plantes Micro-organismes développe des outils pour l'annotation semi-automatique structurale et fonctionnelle des génomes. iANT est à la fois une boîte à outils proposant des outils pour réaliser l'annotation et l'analyse des données de génomiques, ainsi qu'une plateforme permettant aux biologistes d'accéder à ces données, les modifier et les publier sous forme de portail web.
La boîte à outil propose une batterie de scripts documentés destinés à l'annotation fonctionnelle. Ces outils sont utilisés par les bioinformaticiens via leur intégration dans d'autres outils. La majorité est également disponible via la technologie des Web-services BioMOBY ou via la plateforme Mobyle.
La plateforme web destinée aux biologistes authentifiés permet à ces derniers de :
-
modifier l'annotation structurale et fonctionnelle automatique des différents objets biologiques.
-
rechercher des informations sur leur génome via un moteur de recherche et/ou via des outils d'analyse de séquence classiques (serveur Blast, serveur PatScan)
-
naviguer dans le génome via des représentations graphiques de ce dernier
-
lancer des analyses complexes via des workflows Remora
-
-
-
-
Développements:
Les développements sont réalisés sur la Plateforme Bioinformatique du LIPM. Ils consistent principalement en la maintenance évolutive des outils (ex : migration SRS vers Lucene, modèle des données orienté objet), l'intégration de nouveaux outils et l'automatisation du déploiement de portails web dans le cadre de projets de reséquençage d'organismes prokaryotes à grande échelle.
Références des publications des génomes ayant utilisé iANT :
Galibert F, et al. The composite genome of the legume symbiont Sinorhizobium meliloti. Science. 2001 Jul 27;293(5530):668-72.
Salanoubat M, et al. Genome sequence of the plant pathogen Ralstonia solanacearum. Nature. 2002 Jan 31;415(6871):497-502.
Sullivan JT, et al. Comparative sequence analysis of the symbiosis island of Mesorhizobium loti strain R7A. J Bacteriol. 2002 Jun;184(11):3086-95.
Saillard C, et al. The abundant extrachromosomal DNA content of the Spiroplasma citri GII3-3X genome. BMC Genomics. 2008 Apr 28;9:195.
Pieretti I, et al. The complete genome sequence of Xanthomonas albilineans provides new insights into the reductive genome evolution of the xylem-limited Xanthomonadaceae. BMC Genomics. 2009 Dec 17;10:616.
Portail Meloidogyne incognita
URL: http://www.inra.fr/meloidogyne_incognita/
Coordinateurs : Etienne Danchin, Jérôme Gouzy, Laetitia Perfus-Barbeoch
Auteurs :
abad@sophia.inra.fr1,2,3, Jerome.Gouzy@toulouse.inra.fr4, Philippe.Castagnone@sophia.inra.fr1,2,3, Etienne.Danchin@sophia.inra.fr1,2,3, Emeline.Deleury@sophia.inra.fr1,2,3, Laetitia.Zurletto@sophia.inra.fr1,2,3, Erika.Sallet@toulouse.inra.fr4, Martine.Darocha@sophia.inra.fr1,2,3, Bruno.Favery@sophia.inra.fr1,2,3
1 INRA, UMR 1355 ISA, 400 route des Chappes, F-06903, Sophia-Antipolis, France,
2 CNRS, UMR 7254 ISA, 400 route des Chappes, F-06903, Sophia-Antipolis, France,
3 Université de Nice-Sophia Antipolis, UMR ISA, 400 route des Chappes, F-06903, Sophia-Antipolis, France,
4 Laboratoire des Interactions Plantes-Microorganismes (LIPM), UMR INRA-CNRS 441/2594, F-31320 Castanet Tolosan, France.
Mots clés : Outils Gmod, apollo, blast, Meloidogyne incognita, web-service,
Ce portail a été crée dans le cadre du projet de séquençage du génome de Meloidogyne incognita(1) en 2008. L'obtention de ce génome est une avancée majeure pour l'étude des nématodes parasites de plantes pour preuve l'article sur le génome a déjà été cité plus de 160 fois en moins de 4 ans. Le site «nematode.net«, dédié à l'étude des nématodes de façon générale et qui rassemble l'ensemble des ressources sur les nématodes, donne notre portail comme la référence pour l'accès aux données et aux analyses bioinformatiques réalisées lors du séquençage de Meloidogyne incognita.
On retrouve sur le portail les résultats à la fois de l'annotation automatisée (réalisé grâce à Eugene) et de l'annotation manuelle expertisée, visualisable grâce à deux «genome browsers» gbrowse et Apollo. Un serveur Blast est accessible permettant de faire des «blast» sur le génome, sur les différentes banques de séquence d'EST ou sur les protéines prédites de M. incognita. Les résultats des analyses effectuées sur le génome avec d'autres outils bioinformatiques (OrthoMCL, Interproscan, etc.) sont aussi accessibles sur le site.
L'accès aux données est public à l'exception d'une partie qui n'est accessible uniquement qu'aux membres du consortium sous le contrôle d'un système de login/password.
(1) Abad P, Gouzy J, Aury J, Castagnone-Sereno P, Danchin EGJ, Deleury E & all: Genome sequence of the metazoan plant-parasitic nematode Meloidogyne incognita. Nat Biotechnol 2008, 26:909-915.
Dostları ilə paylaş: |