Proteinski domen je dio proteinske sekvence i strukture koji može evoluirati, funkcionirati i postoji nezavisno od ostatka proteinskog lanca. Svaki domen formira kompaktnu trodimenzijsku strukturu i često može biti samostalno stabilan i savijen. Mnogi proteini sadrže nekoliko strukturnih domena. Jedan domen se može javiti u nizu različitih proteina.
Koncept domen prvi je predložio Vetlaufer 1973. na osnovu kristalografskih rengenskih studija živinskog lizozima[1] i papaina[2] i ograničenih proteolitičkih ispitivanja imunoglobulina.[3][4] Definirao je domene kao stabilne jedinice proteinske strukture koje se mogu autonomno sklapati. U prošlosti su domeni bili opisani kao jedinice:
Sve te definicije su validne i često se preklapaju, naprimjer za kompaktni strukturni domen koji je nađen u nizu različitih proteina i vjerovatno se samostalno sklapa i savija unutar svog strukturnog okruženja. Priroda često povezuje nekoliko domena čime se formiraju multidomeni i multifunkcionalni proteini sa velikim brojem mogućnosti.[7] U multidomenskom proteinu, svaki domen može obavljati svoju funkciju neovisno ili organizirao sa svojim susjedima. Domeni mogu da služe bilo kao moduli za izgradnju velikih sklopova, kao što su virusne čestice ili mišićna vlakna ili do pruže specifična katalitska ili mjesta vezanja kod enzima ili regulatornih proteina.
Primjer proteina sa više domena je piruvat-kinaza, glikolitski enzim koji ima važnu ulogu u regulaciji fluksa od fruktoza-1,6-bifosfata do piruvata. Ovaj protein sadrži sve-β regulatorni domen, α/β-supstrat vezujući domen i α/β-nukleotid vezujući domen, koji su povezani s nekoliko polipeptidnih veza.[8]. Svaki domen u ovom proteinu pojavljuje se u različitim grupama porodica proteina.
Centralni α/β-barelni domen, koji vezuje poslogu, je jedan od uobičajenih enzimskih sklopova. Prisutan je kod mnogih različitih enzimskih porodica koje katalizuju sasvim nevezane reakcije.[9] Barel α/β se obično naziva TIM barelom. Ovo ime potiče od trioza-fosfatnih izomeraza, u čijoj strukturi je bio prvo uočen.[10] On je trenutno klasifikovan u 26 homolognih familija u CATH bazi podataka domena.[11] TIM barel formiran je od sekvence β-α-β motiva koji su zatvoreni vodoikovim vezama prvog i zadnjeg lanca, čime se formira barel sa osam lanaca. Postoje različita stanovišta o evolucijskom porujeklu ovog domena. Jedna od studija sugestira da se zajednički predački enzim raščlanio u nekoliko porodica,[12] dok druga smatra da je stabilna struktura TIM-barela evoluirala putem konvergentne evolucije.[13]
TIM-barel piruvat-kinaza je diskontinuiran, što znači da je više od jednog polipeptidnog segmenta neophodno da bi se formirao domen. To je vjerovatno posljedica insercije jednog domena u drugi tokom evolucije ovog proteina. Bilo je pokazano da je među poznatim strukturama diskontinuirana jedna četvrtina strukturnih domena.[14][15] Insertirani β-barelni regulatorni domen je kontinuiran, jer se sastoji od jednog neprekinutog segmenta polipeptida.
Kovalentna veza dva domena ima funkcionalnu i strukturnu prednost jer povećava stabilnost u poređenju sa istim strukturama bez kovalentne veze.[16] Druge prednosti su zaštita intermedijara unutar inter-domenskog enzimskog otvora, koji bi inače bio nestabilan u vodenom okruženju, i ustaljeni stehiometrijski odnos enzimske aktivnosti koji je neophodan za sekvencijski niz reakcija.[17]
Primarna struktura proteina (lanac aminokiselina) prvenstveno kodira njegovu jedinstvenu 3D konformaciju savijanja.[18] Najvažniji faktor sklapanja proteina u 3D strukturu je distribucija polarnih i nepolarnih bočnih lanaca.[19] Sklapanje dovodi do sklanjanja hidrofobnih bočnih lanaca u unutrašnjost molekula da bi se izbegao kontakt sa vodenim okruženjem. Općenito, proteini imaju jezgro od hidrofobnih ostataka okruženo omotačem hidrofilnih ostataka. Pošto su same peptidne veze polarne, neutraliziraju se međusobnim vodikovim vezama u hidrofobnom okruženju. Time se stvaraju regije polipeptida koji formiraju regularne 3D strukturne motive koji se nazivaju sekundarnim strukturama. Postoje dva glavna tipa sekundarne strukture: α-heliksi i β-listovi.
Priroda je petljanac, a ne izumitelj,[20] jer nove sekvence su prilagođene iz već postojećih sekvenci, a ne izmišljene. Domeni su uobičajeni materijal koji priroda koristi za stvaranje novih sekvenci; mogu se smatrati genetički pokretnim jedinicama, koje se nazivaju „moduli“. Često su C– i N-krajevi domena bliski zajedno u prostoru, što im omogućava da se lahko "ubace" u roditeljske strukture tokom procesa evolucije. Mnoge domenske porodice nalaze se u sva tri oblika života, Archaea, Bacteria i Eukarya.[21] Proteinski moduli su podskupovi proteinskih domena koji se nalaze u nizu različitih proteina s posebno svestranom strukturom. Primjeri se mogu naći među vanćelijskim proteinima povezanim sa zgrušavanjem, fibrinolizom, komplementom, vanćelijskim matriksom, molekulama adhezije na ćelijskoj površini i receptorima citokina.[22] Četiri konkretna primjera široko rasprostranjenih proteinskih modula su domeni: SH2, imunoglobulinski, fibronektinski tip 3 i kringle.[23]
Molekulska evolucija stvara porodice srodnih proteina sa sličnom sekvencom i strukturom. Međutim, sličnosti sekvenci mogu biti izuzetno niske između proteina koji dijele istu strukturu. Proteinske strukture mogu biti slične jer su proteini odstupili od modela zajedničkog pretka. Alternativno, neki nabori mogu biti favoriziraniji od drugih jer predstavljaju stabilne aranžmane sekundarnih struktura, a neki proteini se tokom evolucije mogu konvergirati prema tim savijanjima. Postoji oko 110.000 eksperimentalno određenih 3D proteinskih struktura deponiranih u Banci podataka o proteinima (PDB).[24] Međutim, ovaj skup sadrži mnoge identične ili vrlo slične strukture. Sve proteine treba klasificirati u strukturne porodice, kako bi se razumjeli njihovi evolucijski odnosi. Strukturna poređenja najbolje se postižu na nivou domena. Zato razvijeni su mnogi algoritmi za automatsko dodjeljivanje domena u proteinima poznate 3D strukture.
Baza podataka CATH, klasificira domene u približno 800 složenih porodica; deset od ovih nčina savijanja je visoko zastupljeno i naziva se „super-nabiranje“. Super-nabori su definirani kao nabori za koje postoje najmanje tri strukture bez značajne sličnosti sekvenci.[25] Najnaseljeniji je supernabor α/β-barel, kako je ranije opisano.
Većina bjelančevina, dvije trećine među jednoćelijskim organizmima i više od 80% višećelijskih, su višedomenski proteini.[26] Međutim, druga istraživanja zaključila su da se 40% prokariotskih proteina sastoji od više domena, dok eukarioti imaju približno 65% proteina s više domena.[27]
Mnogi domeni u eukariotskim multidomenskim proteinima mogu se naći kao nezavisni proteini u prokariotima,[28] sugerirajući da su domeni u višedominskim proteinima nekada postojali kao nezavisni proteini. Naprimjer, kičmenjaci imaju multienzimski polipeptid koji sadrži domene GAR-sintetaza, AIR-sintetaza i domen GAR-transformacijaza (GARs-AIRs-GARt; GAR: glicinamid ribonukleotid/transferaza; AIR: aminoimidazol ribonukleotid sintetaza). Kod insekata, polipeptid se pojavljuje kao GAR-ovi (AIR-ovi) 2-GARt, u kvascima se GARs-AIRs kodira odvojeno od GARt, a kod bakterija svaki domen kodiran je zasebno.[29]
Multidomenski proteini vjerojatno su se pojavili zbog selekcijskog pritiska tokom evolucije, kako bi stvorili nove funkcije. Različiti proteini odstupili su od zajedničkih predaka različitim kombinacijama i asocijacijama domena. Modulne jedinice često se kreću, unutar i između bioloških sistema putem mehanizama genetičkog miješanja:
Najjednostavnija organizacija multidomena koja se vidi u proteinima je organizacija jednog domena koji se ponavlja u tandemu.[31] Domeni mogu međusobno komunicirati (interakcijama domen-domen) ili ostati izolirani, poput perlica na žici. Ogromni mišićni protein od 30.000 ostataka, titin sastoji se od oko 120 domena tipa fibronektina-III i Ig-tipa.[32] U serinskimproteazama, duplikacija gena dovela je do stvaranja enzimskih domena s dva β-barela.[33] Ponavljanja su se toliko razlikovala da među njima nema očigledne sličnosti u sekvenci. Aktivno mjesto nalazi se na rascjepu između dva β-barelska domena, u koji iz svakog domensa doprinose funkcionalno važni ostaci. Pokazalo se da genetički modificirani mutanti himotripsinaserin-proteazama imaju određenu aktivnost proteinaza, iako su njihovi ostaci na aktivnom mjestu ukinuti, pa je stoga pretostavljeno da je duplikacija povećala aktivnost enzima.[33]
Moduli često pokazuju različite odnose povezivanja, što ilustriraju kinezini i ABC transporteri. Motorni domen kinezina može biti na bilo kojem kraju polipeptidnog lanca koji uključuje regiju s upredenom zavojnicom i domen tereta.[34] ABC transporteri su građeni sa do četiri domena koji se sastoje od po dva nepovezana modula, ATP-vezujuće kasete i integralnog membranskog modula, raspoređenih u različitim kombinacijama.
Ne samo da se domeni rekombiniraju, već postoji mnogo primjera insercija domena u drugi. Sekvencna ili strukturne sličnosti s drugima domeni pokazuju tako da homolozi insefrtiranih i roditeljskih domena mogu postojati nezavisno. Primjer je kod 'prstiju' umetnutih u 'dlan' domen unutar polimerazne porodice Pol I.[35] Budući da se domen može umetnuti u drugi, uvijek bi trebao postojati barem jedan kontinuirani domen u multidomenskom proteinu. Ovo je glavna razlika između definicija strukturnih domena i evolucijskih/funkcionalnih domena. Evolucijski domen bit će ograničen na jednu ili dvije veze između domena, dok strukturni domeni mogu imati neograničene veze, unutar zadanog kriterija postojanja zajedničkog jezgra. Nekoliko strukturnih domena moglo bi se dodijeliti evolucijskom domenu.
Superdomen sastoji se od dva ili više konzerviranih domena nominalno nezavisnog porijekla, ali je kasnije naslijeđen kao jedna strukturna/funkcionalna jedinica.[36] Ovaj kombimirani superdomen može se javiti u divergentnim proteinima koji nisu srodni samo po genskim duplikacijama. Primjeri superdomena su par proteinska tirozin-fosfataza – C2 domen par u PTEN-u, tenzin, auksilin i membranski protein TPTE2 . Ovaj superdomen nalazi se u proteinima životinja, biljaka i gljiva. Ključna karakteristika PTP-C2 superdomena je konzerviranost aminokiselinskih ostataka u interfejsu domena.
Veliki dio domena je nepoznate funkcije. domen nepoznate funkcije (DUF) je proteinski domen koji nema okarakteriziranu funkciju. Ove porodice su prikupljene zajedno u Pfam bazi podataka koristeći prefiks DUF iza kojeg slijedi broj, s primjerima koji su DUF2992 i DUF1220. U bazi podataka Pfam sada postoji preko 3.000 DUF porodica koje predstavljaju preko 20% poznatih porodica.[37] Iznenađujuće je da je broj DUF-ova u Pfam-u povećan sa 20% (2010.) na 22% (2019.), uglavnom zbog sve većeg broja novih sekvenci genoma. Pfam izdanje 32.0 (2019) sadržavalo je 3.961 DUF-ova.[38]
^Chothia C. (1992). "Proteins. One thousand families for the molecular biologist". Nature. 357 (6379): 543–4. doi:10.1038/357543a0. PMID1608464.
^George RA, Heringa J. (2002). "An analysis of protein domain linkers: their classification and role in protein folding". Protein Eng. 15 (11): 871–9. doi:10.1093/protein/15.11.871. PMID12538906.
^Hegyi H, and Gerstein M. (1999). "The relationship between protein structure and function: a comprehensive survey with application to the yeast genome". J Mol Biol. 288 (1): 147–64. doi:10.1006/jmbi.1999.2661. PMID10329133.
^Banner; Bloomer, AC; Petsko, GA; Phillips, DC; Pogson, CI; Wilson, IA; Corran, PH; Furth, AJ; Milman, JD; et al. (1975). "Structure of chicken muscle triose phosphate isomerase determined crystallographically at 2.5 angstrom resolution using amino acid sequence data". Nature. 255 (5510): 609–614. doi:10.1038/255609a0. PMID1134550. Eksplicitna upotreba et al. u: |author= (pomoć)
^Orengo CA, Michie AD, Jones S, Jones DT, Swindells MB, Thornton JM. (1997). "CATH--a hierarchic classification of protein domain structures". Structure. 5 (8): 1093–108. doi:10.1016/S0969-2126(97)00260-8. PMID9309224.CS1 održavanje: više imena: authors list (link)
^Copley, R. R. and Bork, P (2000). "Homology among (betaalpha)(8) barrels: implications for the evolution of metabolic pathways". J Mol Biol. 303 (4): 627–641. doi:10.1006/jmbi.2000.4152. PMID11054297.CS1 održavanje: više imena: authors list (link)
^Lesk AM, Brändén CI, Chothia C. (1989). "Structural principles of alpha/beta barrel proteins: the packing of the interior of the sheet". Proteins. 5 (2): 139–48. doi:10.1002/prot.340050208. PMID2664768.CS1 održavanje: više imena: authors list (link)
^Ghélis C, Yon JM. (1979). "[Conformational coupling between structural units. A decisive step in the functional structure formation]". C R Seances Acad Sci D. 289 (2): 197–9. PMID117925.
^Ostermeier M, Benkovic SJ. (2000). "Evolution of protein function by domain swapping". Adv Protein Chem. 55: 29–77. PMID11050932.
^Cordes, M. H., Davidson, A. R., and Sauer, R. T (1996). "Sequence space, folding and protein design". Curr Opin Struct Biol. 6 (1): 3–10. doi:10.1016/S0959-440X(96)80088-1. PMID8696970.CS1 održavanje: više imena: authors list (link)
^Campbell ID, Downing AK (maj 1994). "Building protein structure and function from modular units". Trends in Biotechnology. 12 (5): 168–72. doi:10.1016/0167-7799(94)90078-7. PMID7764899.
^Ekman D, Björklund AK, Frey-Skött J, Elofsson A (april 2005). "Multi-domain proteins in the three kingdoms of life: orphan domains and other unassigned regions". Journal of Molecular Biology. 348 (1): 231–43. doi:10.1016/j.jmb.2005.02.007. PMID15808866.
^Heringa J (juni 1998). "Detection of internal repeats: how common are they?". Current Opinion in Structural Biology. 8 (3): 338–45. doi:10.1016/S0959-440X(98)80068-7. PMID9666330.
^Politou AS, Gautel M, Improta S, Vangelista L, Pastore A (februar 1996). "The elastic I-band region of titin is assembled in a "modular" fashion by weakly interacting Ig-like domains". Journal of Molecular Biology. 255 (4): 604–16. doi:10.1006/jmbi.1996.0050. PMID8568900.
^ abMcLachlan AD (februar 1979). "Gene duplications in the structural evolution of chymotrypsin". Journal of Molecular Biology. 128 (1): 49–79. doi:10.1016/0022-2836(79)90308-5. PMID430571.
Dyson HJ, Sayre JR, Merutka G, Shin HC, Lerner RA, Wright PE (august 1992). "Folding of peptide fragments comprising the complete sequence of proteins. Models for initiation of protein folding. II. Plastocyanin". Journal of Molecular Biology. 226 (3): 819–35. doi:10.1016/0022-2836(92)90634-V. PMID1507228.
Heringa J, Argos P (juli 1991). "Side-chain clusters in protein structures and their role in protein folding". Journal of Molecular Biology. 220 (1): 151–71. doi:10.1016/0022-2836(91)90388-M. PMID2067014.
Yang AS, Honig B (septembar 1995). "Free energy determinants of secondary structure formation: I. alpha-Helices". Journal of Molecular Biology. 252 (3): 351–65. doi:10.1006/jmbi.1995.0502. PMID7563056.
Yang AS, Honig B (septembar 1995). "Free energy determinants of secondary structure formation: II. Antiparallel beta-sheets". Journal of Molecular Biology. 252 (3): 366–76. doi:10.1006/jmbi.1995.0503. PMID7563057.
SUPERFAMILYArhivirano 8. 2. 2014. na Wayback Machine Library of HMMs representing superfamilies and database of (superfamily and family) annotations for all completely sequenced organisms