1 Utilisant la technique FRET (Fluorescent Resonance Energy Transfer), et FRAP (Fluorescence Recovery After Photobleaching) un groupe de chercheurs japonais vient d'analyser le fonctionnement des voies de signalisation de Ras et de Rap1 dans des cellules. N Mochizuki et al.; Nature 411 (28JUN01) 1065-1068. Voir également le commentaire de JL Bos; p. 1006-1007. ###
La technique FRET utilise deux molécules fluorescentes qui doivent être suffisamment proches pour permettre un transfert de l'énergie de fluorescence. Elle permet de détecter l'activation d'une protéine par déclenchement de la fluorescence d'un marqueur fluorescent comme la GFP ou ses variants, fusionné avec la protéine dont on veut suivre un changement de conformation (une activation par exemple, ici de l'activité GTPase) qui déclenche la fluorescence de la protéine chimérique. La coaptation Ras-Raf est détectée par le changement de fluorescence.
La fluorescence de Ras, ancrée du côté cytoplasmique de la membrane plasmique, est déclenchée au voisinage de la surface dans des cellules Cos activées par l'EGF (Epidermal Growth Factor) et on peut suivre l'internalisation d'un complexe associant Ras au guanine-nucleotide-exchange factor sos et probablement le récepteur.
Une autre protéine voisine, Rap1, caractéristique des endosomes où le tri des protéines néosynthétisées vers leurs différentes destination est assuré, est activée à la périphérie du noyau. Son activation suppose une internalisation préalable d'un complexe récepteur.
Les résultats les plus surprenants concernent Rap1. Ils indiquent que la protéine commande une voie de signalisation vers la membrane plasmique et que son homologue chez la levure, Bud1, assure la collecte des protéines nécessaires au bourgeonnement au niveau de la membrane plasmique.
2 Des chercheurs de Rockefeller University décrivent dans B Dubertret et al.; Nature Biotechnology 19 (APR01) 365 370, une technique permettant de visualiser un défaut d'appariement d'un seul nucléotide. Elle est basée sur le déclin (quenching) de la fluorescence d'un fluorophore par une particule d'or de 1,4 nm portant une sonde ADN simple brin. En cas d'appariement la fluorescence est révélée par accroissement de la distance entre fluorophore et particule d'or.
3 Il est possible, dans certains cas, d'établir directement la séquence des évènements d'une voie donnée sans utiliser de mutants, "simplement" en analysant la cinétique d'expression des gènes. C'est ce qui vient d'être fait dans le cas de l'assemblage du flagelle d'Escherichia coli. On sait que 14 opérons interviennent dans cet assemblage. Les auteurs ont construit 14 plasmides utilisant les promoteurs de chacun de ces opérons fusionnés avec la séquence codante de la GFP (protéine fluorescente verte). La technique évite d'avoir à casser les cellules, comme dans le cas des microréseaux ADN ou de l'utilisation de lacZ. S Kalir et al.; Science 292 (15JUN01) 2080-2083.
4 On utilise depuis un certain temps la technique MALDI (Matrix-Assisted Laser Desorption/Ionization) et l'"electrospray ionization" associée à la spectrométrie de masse pour résoudre les fragments désorbés. Une version dérivée vient d'être décrite avec la désorption/ionisation sur silice (DIOS) utilisable pour les protéines et les petites molécules. JJ Thomas et al.; Proceedings of the National Academy of Sciences of the United States of America 98 (24APR01) 4932-4937. Dans ce cas il n'y a pas de matrice dont on décolle les molécules à caractériser par un faisceau laser comme dans la MALDI. La DIOS-MS n'entraîne que peu de fragmentation de la molécule (ce qui est utile quand on veut mesurer l'activité) et supporte relativement bien la présence de contaminants, ce qui permet de conserver des activités. La technique a été utilisée sur une estérase, une glycosidase, une lipase et des protéases en utilisant des substrats enzyme-spécifiques. L'activité peut être mesurée en présence d'inhibiteurs, ou assurer des analyses multiples sur une même protéine. Ceci a été démontré pour une acétylcholine-estérase.
5 On trouvera dans H Vrieling; Nature Genetics 28 (JUN01) 101 102, un commentaire sur les conséquences de la recombinaison mitotique, notamment la perte de l'hétérozygotie. Il est basé sur l'article de C Shao et al.; p. 169 172.
C'est un mécanisme compensant, durant les phases S et G2, la non-réparation d'erreurs au cours de la réplication de l'ADN, et qui consiste à emprunter de longs segments d'ADN au chromosome homologue. Le résultat ressemble à une conversion génique qui est due à une réplication utilisant momentanément le chromosome homologue comme modèle, et qui est plus fréquente, mais ne concerne cependant que de courtes séquences. Chez la souris c'est cependant la source principale de perte de l'hétérozygotie dans les cellule somatiques
Shao et al. ont utilisé des hybrides de lignées de souris ayant un seul gène fonctionnel d'adénine phosphoribosyltransférase. Un retour à l'homozygotie pour l'allèle non fonctionnel entraîne une résistance à la diaminopurine à la suite de la perte des deux gènes normaux. Ils ont croisé des souris génétiquement distantes, Mus musculus et Mus spretus. Dans ce cas, la recombinaison mitotique est observée dans des cellules T, mais pas dans des fibroblastes de l'oreille en culture, alors que la recombinaison méiotique donne la proportion attendue de sensibles. Si maintenant on croise des Mus musculus avec la souris plus proche, Mus castaneus, les hybrides présentent une recombinaison somatique dans les cellules T, mais pas dans des fibroblastes de l'oreille en culture. Des croisements en retour permettent d'améliorer l'homologie, et on voit apparaître une recombinaison somatique.
6 La technique de "chiméraplastie" de Kimeragen (absorbée récemment par Valigene) est théoriquement séduisante. Elle consiste à utiliser une double épingle à cheveu chimère ADN et ARN 2'O-méthylé de 68 nucléotides pour des modifications ciblées d'ADNs, la formation d'hybrides intramoléculaire et la méthylation étant supposées protéger la construction contre les nucléases extracellulaires. L'hybridation dans le noyau reposerait sur une zone homologue de 25 pb dans laquelle on peut introduire des substitutions de nucléotides (voir le brevet mondial WO99-58723 du 18NOV99). Elle fonctionne manifestement, mais dans certaines mains et pas dans d'autres (plusieurs de ces publications sont citées dans les bulletins de Novembre 1999, Février, Mars, Avril et Septembre 2000). Il est de fait que si le nombre de publications s'accroît, celles-ci sont toujours issues d'un nombre stagnant d'équipes. Des chercheurs hollandais suggèrent de faire un effort de partage des techniques et des lignées cellulaires pour améliorer la reproductibilité des résultats. Ils ont en effet observé un succès dans la modification d'un gène de tyrosinase (la technique fonctionne donc) mais quatre autres essais ont échoué dans le propre laboratoire du promoteur de cette technique. L'explication exacte manque (voir le bulletin de Mars 2000) et même son promoteur a changé d'avis sur le sujet. G van der Steege et al.; Nature Biotechnology 19 (APR01) 305 306.
9 La publication de la séquence du génome de la Drosophile par Celera Genomics a amené beaucoup de gens à regarder de plus près les résultats. L'une des analyses, celle de S Karlin et al.; Nature 411 (17MAY01) 259-260 émane du département de mathématiques de Stanford.
Ils ont comparé l'annotation de Celera avec la banque de données de protéines SwissProt et ils ont constaté que plusieurs contradictions existent, malgré la validité générale des données publiées.
Ils ont extrait 1 049 séquences de protéines de SwissProt et les ont comparées avec les données du protéome vu par Celera en utilisant BLAST. Ils ont constaté que 26% des séquences de SwissProt "collent" parfaitement avec celles de Celera, 29% ont la même longueur avec 99% de similarités avec la séquence de la protéine enregistrée à SwissProt.
Les 45 % qui restent ont au moins 1% de différences le long de la séquence (voir des exemples à http://gnomic.stanford.edu).
La protéine à homeobox HMCU codée par le gène cut possède 2,175 aminoacides (SwissProt database), sans équivalents (BLASTP match) dans la séquence de Celera. Seulement 14% de la séquence dans SwissProt se retrouve dans celle de Celera..
Le canal à potassium codé par le gène shaker a 643 aminoacides dans SwissProt et 708 dans la séquence de Celera, un exon a du être raté par Celera
Le produit du gène trithorax gene possède, selon SwissProt, 3 759 aminoacides mais seulement 3 085 pour Celera. On constate une délétion au niveau de l'acide aminé 238 de deux paires de bases compensée par un insertion de deux paires de bases différentes, 33 acides aminés plus loin. On observe deux délétions de 27 et 34 acides aminés plus loin dans la séquence de Celera.
Dans le cas du facteur de différenciation neuronal Prospero une erreur réside dans les 300 premiers acides aminés omis dans la séquence de Celera (tout le reste est identique). Celera a dû mal interpréter le signal de début de traduction.
Celera a, par ailleurs, du mal à enregistrer des répétitions d'acides aminés, glycines dans HMOC (orthodenticle homeotic protein), des asparagines dans HMCA (homeotic caudal protein) et glutamines dans CEB (enhancer-binding protein).
Il existe certainement un polymorphisme chez la Drosophile mais on ne connait pas son importance. Celera indique que les séquences d'au moins 1 600 gènes de sa séquence diffèrent au niveau de l'ADN de séquences antérieurement publiées.
L'utilisation des banques de données de protéines permet d'identifier des gènes de protéines voisines mais ne permettent pas d'identifier complètement de nouveaux gènes, mais on pourrait s'en servir pour mieux prédire les exons (codant les acides aminés).
Il est difficile de détecter des motifs classiques mais trop petits (5–15 résidus comme les séquences fixant GTP ou ADP par exemple) avec BLAST qui est un logiciel optimisé pour la rapidité mais pas pour la finesse de la détection, mais on peut l'utiliser pour la prédiction de certains exons particuliers..
Une autre méthode consiste à rechercher, au contraire et dans le but d'identifier les séquences codantes, des motifs très courts (comme GPPGP, CGKAF ou HTGGK) fréquents dans certaines protéines mais dont la séquence codante est rare dans les séquences non codantes. On peut utiliser d'autres particularités statistiques de certaines protéines.
Les prévisions de gènes basées uniquement sur des données statistiques ou d'homologie sont encore insuffisantes malgré l'existence de plus d'une vingtaine de programmes élaborés dans ce but. Il reste finalement toujours à vérifier expérimentalement les données obtenues.
10 On trouvera dans BL Bass; Nature 411 (24MAY01) 428-429, un commentaire sur l'interférence par ARN (RNAi) découverte en 1998 (A Fire et al. Nature 391 (19FEB98) 806-811) chez Caenorhabditis elegans. Elle permet, une fois la séquence d'un gène connue de déterminer sa fonction. La RNAi est un processus séquence spécifique et post transcriptionnel qui aboutit à l'extinction de l'expression (silencing) d'un gène ayant la même séquence. Il est dû à des ARNs doubles brins de 21 à 22 paires de bases (short interfering (si) RNAs) avec de courts dépassements simple brin en 3', produits d'un clivage par la ribonucléase III d'ARNs doubles brins plus longs. Leur intervention entraîne la destruction des transcrits des gènes homologues par un mécanisme dont les enzymes ne sont pas clairement identifiée (Voir le bulletin de Juillet 2000) On vient de montrer que ce système très connu et utilisé chez les plantes et surtout C. elegans (voir le Bulletin de Décembre 2000).
On a eu, cependant, des ennuis dans les cellules de mammifères, car la synthèse globale des protéines est alors bloquée quelles que soient les séquences utilisées. Cependant SM Elbashir et al.; p.494-498, viennent d'avancer dans ce domaine. Ils viennent d'utiliser le fait que le mécanisme global gênant n'est déclenché que par des ARNs doubles brins longs d'au moins 30 paires de bases. Ils l'ont vérifié et révélé que la RNAi fonctionne bien si on fournit des siRNAs, et ont utilisé le processus sur des transgènes de luciférases de Renilla reniformis et de Photinus pyralis, dont on peut facilement mesurer le niveau d'expression. Les siRNAs ont été transférés par des liposomes cationiques dans de nombreuses cellules de mammifères. La seule différence notable avec les autres systèmes connus porte sur le fait que la suppression de l'expression n'est pas parfaite, contrairement à ce qui se passe chez la Drosophile par exemple. Mais dans les cellules de mammifères les siRNAs agissent à des concentrations qui sont plusieurs ordres de grandeur inférieurs à ceux nécessités par les antisens.
11 L'US Patent 6 242 258 (05JUN01) de Vanderbilt University couvre une méthode de coiffage covalent d'acides nucléiques antisens par des molécules photolabiles. Ceci les empêche d'être exprimées, alors qu'une irradiation les libère.
12 On trouvera dans N Trethewey; Current Opinion in Biotechnology 12 (APR01) 135 138, une utilisation du "metabolic profiling" pour identifier des gènes d'un métabolisme donné. Ce chercheur fait partie de la firme Metanomics issue du laboratoire de Willmitzer à Berlin.
La technique reine jusqu'à présent est celle des réseaux d'expression sous forme de messagers et, plus récemment, les techniques de protéomiques, qui ne représentent cependant pas toujours un outil idéal de caractérisation d'une fonction. Un changement dans l'abondance d'un messager ne signifie pas que le gène en question a un rôle dans le mécanisme étudié. Il faut donc compléter les données acquises (en nombre) avec les microréseaux pour éviter toute ambiguïté. Il en est de même pour les protéines. Une approche biochimique a été décrite dans le cas des plantes par le même groupe dans RN Trethewey et al.; Current Opinion in Plant Biology 2 (FEB99) 83 85.
L'article traite surtout sur deux approches complémentaires de la génomique biochimique. L'une crible in vitro les produits de cDNAs pour une activité donnée. La seconde est l'application du profil métabolique (metabolic profiling) à l'analyse de mutants et de plantes transgéniques.
Le criblage in vitro a déjà été utilisé pour identifier la fonction d'une ORF donnée. Ils ont pour cela créé 6080 souches de levure, chacune codant une protéine de fusion de la glutathione S transférase (GST) avec une ORF de fonction inconnue sous la commande d'un promoteur inductible par le cuivre.
Soixante quatre pools de 96 fusions ont été créés. On lance l'expression avec du sulfate de cuivre. On purifie les protéines par affinité grâce à la GST. Ces mixtures peuvent être soumises à n'importe quel essai biochimique. On retourne classiquement aux 96 clones en cas de réponse positive. Cette méthode est quasi-universelle, mais elle a également des limitations. La première est la possibilité que la fusion puisse annihiler la fonction. La seconde est une toxicité potentielle de la protéine de fusion ou une modification des fonctions cellulaires, enfin la plus évidente est celle que des co-facteurs soient nécessaires à la fonction qui est essayée ici in vitro.
Le profil métabolique consiste à caractériser le plus grand nombre possible de métabolites par une technique comme la chromatographie gazeuse/spectrométrie de masse (GC MS) quand on change le niveau d'expression ou la nature d'une seule enzyme par exemple. Cela a été appliqué par le groupe de Willmitzer au tubercule de la pomme de terre où 150 composants ont été caractérisés et quantifiés. La méthode est bien utilisable car la déviation standard entre tubercules ne dépasse pas 10 25%. Les mesures valent bien celles des réseaux ADN. Elles sont nettement plus rapides à obtenir, ainsi pour les conséquences de la surexpression d'une invertase.
Le problème réside dans les très nombreux métabolites à suivre, ce que la GC-MS ainsi que la RMN permettent de mesurer (pour la RMN voir R Bligny et al.; Current Opinion in Plant Biology 4 (JUN01) 191-196) Cette technique a été étendue à d'autres systèmes comme le métabolisme des feuilles de quatre génotypes d'Arabidopsis avec 326 composés distincts à suivre (O Fiehn et al.; Nature Biotechnology 18 (NOV00) 1157-1161, voir le Bulletin de Décembre 2000).
La méthode FANCY décrite dans LM Raamsdonk et al.; Nature Biotechnology 19 (JAN01) 45-50, commentée par GH Thomas Trends in Biotechnology 19 (APR01) 126-127 et dans le Bulletin de Mai, appartient à ce type de techniques.
14 Une utilisation des microréseaux dans l'identification des sites reconnus par les doigts à zinc de certains facteurs de transcription est décrite dans ML Bulyk et al.; Proceedings of the National Academy of Sciences of the United States of America 98 (19JUN01) 7158-7163. Le but est de mieux comprendre l'interaction protéine/ADN, c'est à dire la fixation du facteur sur les promoteurs et de prévoir quel facteur aura tendance à se fixer sur les promoteurs d'un gène donné, et donc à le réguler. Une bibliothèque de phages exprimant un des doigts à zinc d'un facteur de transcription donné, dont les acides aminés critiques ont été échangés au hasard, est confrontée à un microréseau contenant des sites de fixation de toutes les combinaisons de 3 pb possibles, ce qui a permis de quantifier les interactions. Le travail est présenté par Aaron Klug qui est maintenant l'animateur de Gendaq, société dont un signataire de l'article est membre.