Le séquençage des protéines est la détermination de la séquence polypeptidique. Elle est destinée à connaître le nombre, la nature chimique et l'ordre de tous les résidus d'acides aminés dans un polypeptide. Pour cela, si la protéine contient plus d'une chaîne polypeptidique, les chaînes doivent être d'abord séparées, puis purifiées. Généralement, toutes les liaisons disulfures seront réduites et les thiols ainsi obtenus alkylés. Après isolement d'une chaîne polypeptidique, la séquence peut être étudiée :
Le séquençage des protéines est plus difficile que celui de l'ADN.
C'est dans les années 50 que Frederick Sanger et les chercheurs de l'université de Cambridge ont déterminé la séquence des acides aminés qui composent l'insuline. Pour cela, plutôt que d'hydrolyser complètement l'hormone, ils ont utilisé des enzymes catalysant la coupure des polypeptides au niveau de sites spécifiques. Les fragments résultants ont été séparés par chromatographie, puis partiellement hydrolysés pour donner un nouveau groupe de fragments. À ce stade, Sanger utilisa des méthodes chimiques pour déterminer la séquence des acides aminés. À partir des séquences obtenues il rechercha des chevauchements afin de reproduire la séquence initiale. Il fallut plusieurs années à Sanger pour reconstituer la structure primaire de l'insuline. Depuis, la plupart des étapes du séquençage des protéines ont été automatisées. Actuellement le séquençage des protéines a été largement délaissé au profit de celui des acides nucléiques (ADN principalement et ARN), plus rapide et plus performant.
Chaque protéine est une macromolécule constituée par l'enchaînement de molécules de masse moléculaire plus petite appelées monomères : les acides aminés.
Les acides aminés (AA) s'assemblent grâce à des liaisons peptidiques (groupement acide carboxylique d'un AA avec le groupement amine d'un AA voisin → C=O—NH), et forment ainsi la structure primaire. La liaison peptidique est plane dans l'espace et les radicaux sont en opposition. La structure primaire ne permettra d'avoir uniquement les enchainements d'acides aminé. Celle-ci n'a pas de propriété physiologique particulière.
La structure secondaire peut se manifester sous deux formes:
Cette structure est due à l'existence de liaisons hydrogène qui se forment entre des liaisons peptidiques voisines.
Soit le feuillet plissé , soit l'hélice s'assemblent en structure tertiaire[1] par des liaisons secondaires qui se créent entre les radicaux des acides aminés qui, lors de la formation de la structure secondaire, se sont retrouvés à l'extérieur de la structure (exemples : liaison saline, hydrogène, pont disulfure). Ces liaisons, hormis le pont disulfure qui est une liaison covalente forte, sont des liaisons faibles.
Ce repliement de la chaîne peptidique amène la création d'un site actif responsable de l'activité biologique de la protéine. (cf Enzymes)
Certaines protéines, dites oligomériques (constituées par plusieurs chaînes de polypeptides – chaque chaîne présente une structure primaire, secondaire et tertiaire), telle que l'hémoglobine par exemple, atteignent une structure quaternaire en adoptant une construction symétrique et paire par l'association de ces différents protomères. Ces protéines ne voient la création de leur site actif que lorsque cette structure a été atteinte.
La dénaturation est une désorganisation de la structure spatiale sans rupture des liaisons peptidiques, car seules les liaisons secondaires sont concernées.
Ils sont nombreux et peuvent être physiques ou chimiques. On utilise certains de ces agents dénaturants pour obtenir une structure primaire, utile au séquençage des protéines (détermination de l'ordre des acides aminés dans la chaine peptidique).
In vitro : pour les extractions d'enzymes, on évite les dénaturations. Mais pour une stérilisation, on les provoque.
C'est également en faisant agir des dénaturants sur des protéines que l'on va pouvoir les séquencer.
La rupture des ponts disulfure entre les cystéines est avant tout une dénaturation chimique, qui est de plus essentielle pour pouvoir séparer les différents groupes d'acides aminés. On utilise à cet effet des agents réducteurs porteurs de fonctions thiol (–SH), comme le β-mercaptoéthanol ou le dithiothréitol (réactif de Cleland). Il existe également des réducteurs non-thiolés comme le TCEP (Tris (2-carboxyethyl) phosphine). Il faut savoir également que deux cystéines sont réunies par leur groupement thiol (–SH), et forment alors une molécule appelée cystine. La cystéine est un acide aminé, elle peut donc être dénaturée. Le pont disulfure est responsable de la structure tertiaire des protéines, apportant une grande stabilité à cette dernière.
L'hydrolyse des liaisons peptidiques permet de séparer les différents acides aminés, car elles sont responsables de la structure primaire, agissant entre le groupement carboxyle d'un acide aminé (C=O) et le groupement amine (NH2) d'un AA (acide aminé) voisin.
L'hydrolyse totale acide détruisant moins d'acides aminés, elle est en conséquence la méthode d'hydrolyse la plus utilisée.
Après rupture des liaisons disulfures au 2-mercaptoéthanol et une hydrolyse, l'hydrolysat est déposé sur une résine échangeuse d'anions ou de cations. Une fois les fractions récupérées on les colore à la ninhydrine et on mesure l'absorbance à 570nm. On obtient finalement une estimation du pourcentage de chaque acide aminé contenu dans la chaîne (% de résidus alanine...). La détermination de cette composition n’est pas nécessaire pour déterminer la séquence et est de fait de moins en moins pratiquée.
On utilise l'hydrazinolyse, qui coupe les liaisons à 100 °C et donne un acide aminé libre. On peut également utiliser des carboxypeptidases qui coupent l'extrémité C-terminale, il en existe plusieurs types:
Il existe également des méthodes biochimiques utilisant des enzymes capable de couper le premier ou le dernier acide aminé de la chaîne polypeptidique, on les appelle des exopeptidases. Les aminopeptidases clivent la liaison peptidique située juste après le premier acide aminé et libèrent celui-ci. De manière symétrique, les carboxypeptidases clivent la liaison peptidique située juste avant le dernier acide aminé.
Il en existe plusieurs de ces enzymes de spécificités variées, par exemple parmi les carboxypeptidases, on trouve :
En analysant les acides aminés libérés par ces enzymes, il est possible d'analyser la séquence N ou C-terminale de la protéine.
La chaîne polypeptidique est découpée en une série de petits peptides par des hydrolyses enzymatiques ou chimiques.
L'hydrolyse chimique la plus utilisée implique une réaction avec le bromure de cyanogène, qui scinde les liaisons peptidiques dans lesquelles la fonction carboxyle est fournie par des résidus de méthionine.
L'hydrolyse enzymatique utilise les protéases, enzymes qui hydrolysent les liaisons peptidiques. La trypsine catalyse l'hydrolyse des liaisons peptidiques dans lesquelles la fonction carboxyle est fournie par la lysine ou l'arginine, la chymotrypsine permet la coupure du côté C-terminal des acides aminés aromatiques (Phe, Trp et Tyr).
L'identification de la séquence se fait de manière logique à partir des résultats obtenus par l'utilisation des différentes méthodes décrites précédemment.
La fragmentation par spectrométrie de masse MS/MS permet de séquencer des courtes séquences d'acides aminés (10 à 20). Couplée avec les techniques de digestion des protéines précédemment décrite, il est ainsi possible de connaitre la séquence d'une protéine. Cependant, cette approche nécessite d'utiliser différents protocoles de digestion différents pour espérer obtenir l'ensemble de la séquence de la protéine.
Pour un organisme dont le génome est entièrement connu, on utilisera un seul type de digestion (par exemple une digestion par la trypsine suivie d'une analyse par HPLC couplée à un spectromètre de masse de type ESI-MS/MS), ce qui permet d'obtenir jusque 30 % de la séquence de la protéine (ce qui est suffisant pour caractériser la protéine).
Pour un organisme dont le génome n'est pas entièrement connu, on utilise en première intention un séquençage automatisé (séquençage d'Edman par exemple).
Ce séquençage des protéines a conduit à regrouper par familles des enzymes faisant apparaître des séquences acido-aminés similaires. La première lettre de la classification correspond au type de peptidase : A pour les protéases aspartiques, S pour les protéases à cystéine, etc[2].