INTRODUCTION
La protéomique désigne la science qui étudie les protéomes, c'est-à-dire l'ensemble des protéines d'une cellule, organites, tissu, organe ou organisme à un moment donné et sous des conditions données.
Dans la pratique, la protéomique s'attache à identifier les protéines extraites d'une culture cellulaire, d'un tissu ou d'un fluide biologique, leur localisation dans les compartiments cellulaires, leurs modifications post-traductionnelles ainsi que leur quantité.
Elle peut également permettre de quantifier les variations de leur taux d'expression en fonction du temps, de leur environnement, de leur état de développement, de leur état physiologique et pathologique, de l'espèce d'origine.
Elle étudie aussi les interactions que les protéines ont avec d'autres protéines, avec l'ADN ou l'ARN, avec des substances. La protéomique fonctionnelle étudie les fonctions de chaque protéine.
L'analyse protéomique est une étude dynamique. Un seul génome peut conduire à différents protéomes en fonction des étapes du cycle cellulaire, de la différenciation, de la réponse à différents signaux biologiques ou physiques, de l'état physiopathologique, ...
Le protéome reflète les répercussions de ces événements cellulaires au niveau tant traductionnel que post-traductionnel. De ce point de vue, seule une analyse protéique directe peut donner une image globale des systèmes biomoléculaires dans leur complexité.
DIFFERENTES ETAPES DE L'ANALYSE PROTEOMIQUE
Les méthodologies mises en œuvre pour l’analyse du protéome peuvent schématiquement être séparées en deux grands groupes : dans le premier peuvent être regroupées les méthodes expérimentales, reposant principalement sur les techniques de séparation et d’analyse des protéines. Un second groupe de méthodes, fait appel à l’analyse d’images et à la bio-informatique.
Extraction : la première étape consiste généralement à extraire les protéines d'un échantillon biologique. Cette étape est cruciale : une mauvaise extraction peut produire la dégradation des protéines et compliquer, voir rendre impossible, l'identification des protéines. Les protéines membranaires, comportant de nombreux acides aminées hydrophobes et donc peu soluble, restent difficiles à étudier.
Séparation : la seconde étape permet de séparer les protéines en fonction de leurs caractéristiques physiques ou chimiques ou en fonction de leurs affinités pour un ligand.
L'électrophorèse sépare les protéines dans un gel polyacrylamide en fonction de leur taille lorsqu'elles sont soumises à un champ électrique. La méthode d'électrophorèse de référence pour la protéomique est l’électrophorèse bidimensionnelle (2-DE).
La chromatographie utilise la différence d'affinité des protéines entre une phase mobile et une phase stationnaire.
Recherche des protéines d’intérêt par analyse d’image
La coloration des protéines en gel 2-DE reposent principalement sur l’emploi de colorants organiques tel que le bleu de Coomassie, de métaux tels que le nitrate d’argent, ou encore par sur des sondes fluorescentes. La gamme de détection varie d’un facteur d’environ 10000 entre les méthodes utilisant le bleu de Coomassie (détection de spots contenant une quantité de protéine de l’ordre du µg) et celles utilisant le nitrate d’argent qui permettent d’atteindre 0,1 ng. Les colorants fluorescents sont moins sensibles que le nitrate d’argent, cependant ont une plus grande reproductibilité et gamme dynamique.
Quelle que soit la méthode d’analyse utilisée, les spots d’intérêt une fois détectés sont excisés du gel afin d’être identifiés par spectrométrie de masse.
Identification par spectrométrie de masse
L’ identification par SM repose sur une mesure précise de la masse de peptides ionisés. D’une façon très générale les protéines sont digérés par une endopeptidase (le plus souvent la trypsine) et, ensuite analysées par SM.
Une des approches utilisée est l’établissement de cartes peptidiques massiques (« peptide mass fingerprinting »). La masse des peptides obtenus après digestion protéasique est comparée aux cartes de masses théoriques des protéines répertoriées dans les banques de données.
Lorsque les échantillons sont trop complexes (ex : cultures cellulaires, fluides biologiques, …), on utilise la spectrométrie de masse tandem (MS/MS). Dans ce cas, certains fragments peptidiques analysés lors d’une première SM sont choisis et fragmentés. Les pics de masse obtenus constituent une représentation de la séquence protéique, dans laquelle deux pics adjacents diffèrent par la masse d’un acide aminé perdu lors de la fragmentation du peptide analysé.
Interrogation des bases de données
La dernière étape est l'interrogation des bases de données. Les différentes informations récoltées sur les protéines (masse apparente, masse réelle, point isoélectrique, taille des fragments après digestion enzymatique, séquence partielles) sont comparées aux bases de données génomiques ou protéomiques en ligne. Les logiciels fournissent alors une liste de protéines et leurs probabilités associées.
L’organisme dont le génome n'a pas encore été séquencé, Seuls certains organismes, dénommé organisme modèle, ont leurs génomes complètement séquencés et disponibles en ligne. Dans le cas contraire, les organismes sont étudiés par homologie avec les organismes connus.
APPLICATIONS
Identification de protéines dans des mélanges complexes : L’identification de protéines dans des mélanges complexes requiert des instruments capables de détecter un très grand nombre de peptides avec une très bonne sensibilité. En effet, la résolution de ces instruments permet de distinguer des peptides très proches en masse, qui ne seraient ni séparés ni détectés dans un spectromètre de masse moins résolutif. Ceci est très utile, dans ce type d’approche dite « Bottom up », pour obtenir plus d’information sur les acteurs protéiques présents dans des mélanges très complexes. De plus, la large gamme dynamique permet d’obtenir des résultats de qualité, même sur des peptides minoritaires dans l’échantillon.
Séquençage De Novo : L’analyse par séquençage De Novo est souvent une opération difficile, en partie à cause du grand nombre d’interprétations possibles des fragments obtenus en MS/MS. Ce phénomène est amplifié dés lors que l’on considère pour l’interprétation, d’éventuelles modifications surtout dans les espèces où le génome n’est pas encore connu ou entièrement décrypté.
Recherche modifications post-traductionnelles : Les modifications post-traductionnelles sont les éléments clés de la signalisation cellulaire et des interactions entre les cellules au sein des organismes complexes. L’analyse de masse des fragments pourra se faire avec ce type d’instrument, apportant ici une meilleure spécificité, de part la précision de masse ; ainsi on aura des résultats beaucoup plus fiable. Par ailleurs, certains ions fragment « signant » une modification particulière seront facilement reconnaissables, et identifiés sans ambiguïté, c’est le cas par exemple des phospho-tyrosines qui jouent des rôles clés dans les processus de signalisation cellulaire.
Analyse « Top Down » : Il est également possible de travailler directement sur des protéines de petites et moyennes tailles. L’intérêt de cette technique est qu’elle n’utilise pas de digestion enzymatique (« Bottom up ») et permet d’identifier directement une protéine en fragmentant celle-ci dans le spectromètre de masse. Grâce à la haute résolution du système, il est possible à partir de l’analyse des spectres de fragmentation d’identifier la protéine. Cette méthode est complémentaire de l’approche classique par digestion enzymatique, et permet également de mettre en évidence d’éventuelles modifications.