Суперсемейство белков — это наиболее крупная единица группировки белков, для которых может быть предположено наличие общего эволюционного предка (см. гомология (биология)). Обычно суперсемейство объединяется по принципу сходства вторичных и третичных структур («структурного сходства») белков, входящих в него[1] и по принципу сходства механизма действия белков («механистическое сходство» или «функциональное сходство»), несмотря на то, что сходства аминокислотных последовательностей в пределах суперсемейства может не наблюдаться и чаще всего не наблюдается[2]. Суперсемейства обычно содержат несколько семейств белков, которые проявляют сходство аминокислотных последовательностей внутри семейств, но не между семействами. Термин «клан белков» часто применяется по отношению к суперсемействам протеаз, на основании классификации MEROPS[2].
Члены суперсемейства белков, входящие в разные семейства, обычно не проявляют сколько-нибудь значимой или легко обнаруживаемой гомологии аминокислотных последовательностей, имея тем не менее при этом сходные вторичную и третичную структуры и нередко обладая неким функциональным подобием. Часто их бывает почти невозможно или по крайней мере очень трудно выровнять по аминокислотным последовательностям, вследствие часто наблюдаемых вставок и делеций. Например, в суперсемействе PA протеаз ни один аминокислотный остаток не является консервативным в масштабах всего суперсемейства, включая даже те аминокислотные остатки, которые входят в состав каталитических триад этих белков.
И напротив, членов отдельных семейств, входящих в состав суперсемейства, определяют именно по принципу гомологичности аминокислотных последовательностей (первичных структур) белков, входящих в семейство. Например, в суперсемействе PA протеаз есть семейство C04 протеаз.
Вторичная и третичная структуры белков, непосредственно влияющие на их функциональность (например, способность рецептора распознавать лиганды — агонисты и антагонисты, или способность фермента катализировать определённые химические реакции) — гораздо более эволюционно консервативна, чем аминокислотная последовательность. Примером этого является суперсемейство PA протеаз. В нём очень немногие аминокислотные остатки белков проявляют значительную степень эволюционной консервативности, в то время как характерные элементы вторичной структуры, равно как и их пространственное упорядочение в третичных структурах, весьма высоко консервативно.
Программы структурного упорядочения и выравнивания, такие, как программа DALI, могут использовать трёхмерные вторичные и третичные структуры интересующих исследователя белков с имеющейся в них базой данных белковых структур с целью найти белки со сходным фолдингом. Сравнение трёхмерных вторичных и третичных структур белков помогает идентифицировать множество случаев эволюционно связанных (имеющих общего эволюционного предка) белков, сходство которых не было бы выявлено при простом анализе и сравнении их первичных структур (аминокислотных последовательностей).
Каталитический механизм ферментов, являющихся членами суперсемейства, обычно более или менее консервативен в масштабах всего суперсемейства, однако их субстратная специфичность может весьма значительно различаться в масштабах суперсемейства. Как следствие, может значительно варьировать конечное функциональное назначение белков в организме, в зависимости от того, какова их субстратная специфичность. То есть внешнего функционального сходства может и не быть.
Также (хотя и не обязательно и не всегда) каталитический домен у ферментов, являющихся членами суперсемейства, проявляет тенденцию к высокой степени консервативности аминокислотной последовательности в пределах именно этого домена (и уж тем более — вторичной и третичной структуры каталитического домена). Однако даже если аминокислотная последовательность каталитического домена не сохраняется — может сохраняться сам каталитический механизм, и/или вторичная и третичная структуры каталитического домена.
Примером вышеописанного сохранения каталитического механизма в масштабах суперсемейства является, опять-таки, суперсемейство PA протеаз. В нём имеются белки весьма разного конечного функционального назначения (то есть, внешнее функциональное сходство отсутствует) — среди них есть пищеварительный фермент химотрипсин, тромболитический фермент — активатор плазминогена, токсины бактерий и змей и вирусные протеазы, обеспечивающие сборку вирусных частиц. Как уже говорилось выше, в масштабах этого суперсемейства не является эволюционно консервативным ни один аминокислотный остаток, даже в каталитическом домене. И тем не менее все члены суперсемейства имеют значительное сходство специфических каталитических элементов их трёхмерных структур. Более того, хотя члены разных семейств суперсемейства PA протеаз используют разные нуклеофилы, все они производят ковалентный нуклеофильный каталитический протеолиз белков или пептидов по общему каталитическому механизму.
Суперсемейства белков отражают ограниченность наших современных способностей идентифицировать общего предка[3]. Суперсемейства белков — это самое крупное эволюционно значимое объединение сходных белков и генов, которое возможно сделать на текущий момент, основываясь на прямых доказательствах сходства (в случае суперсемейств — в основном структурного, и отчасти по механизму). Поэтому обнаружение трёхмерно-структурного сходства функционально и аминокислотно различных белков у живых существ, отстоящих очень далеко на эволюционной лестнице, является одним из доказательств очень древних (возможно, наиболее древних среди вообще доступных изучению) эволюционных событий.
В некоторых белковых суперсемействах имеются белки, в том или ином виде присутствующие у всех исследованных живых существ (например калиевые каналы), во всех царствах (включая и животные, и растения, и грибы, и бактерий и других прокариот). Это может свидетельствовать, что общим предком белков этих суперсемейств были белки, присутствовавшие у универсального общего предка всех живых существ[4].
Члены суперсемейства могут обнаруживаться у разных видов животных, растений, одноклеточных существ (ортологичные белки). При этом наиболее эволюционно древними являются, очевидно, те члены суперсемейства, которые принадлежат существам, находящимся на самых нижних ступенях эволюционной лестницы. Общим предком для этих белков, очевидно, является белок некоего древнего вымершего существа, которое являлось общим предком для всех тех видов, у которых обнаруживаются белки-представители суперсемейства. Таким образом, изучение ортологичных белков в пределах суперсемейств белков может позволить точнее нарисовать дерево эволюции видов.
Помимо этого, в одном и том же организме животного, растения или одноклеточного существа одного и того же вида могут обнаруживаться несколько разных представителей некоего суперсемейства белков (в том числе выполняющие разные функции). Такие белки называют паралогичными. Эти паралогичные белки также могут происходить от одного общего белкового предка, который на каком-то этапе эволюции дуплицировался в геноме данного вида. Изучение паралогичных белков, их сходств и различий, помогает пролить свет на пути функциональной эволюции белков.
Несколько биологических баз данных документируют суперсемейства белков, в частности: