CASP

Пример белка из CASP8. Целевая структура показана цветом в ленточной модели. Показано наложение 354 предсказанных структур (серый цвет, визуализация остова).

CASP (англ. Critical Assessment of protein Structure Prediction, критическая оценка предсказания белковых структур) — масштабный эксперимент по предсказанию белковых структур. Проходит с 1994 года с периодичностью каждые два года.[1] CASP объективно тестирует методы предсказания белковых структур и предоставляет независимую оценку структурного моделирования. Основная цель CASP — помощь в улучшении методов определения трехмерной структуры белков из их аминокислотных последовательностей. Более 100 исследовательских групп принимают участие в проекте на постоянной основе. CASP считается всемирным соревнованием в науке структурного моделирования.

Выбор белков

[править | править код]

Один из главных принципов CASP — отсутствие у участников какой-либо предварительной информации о белке, кроме аминокислотной последовательности. По этой причине в CASP используется двойной слепой метод — ни организаторы, ни эксперты, ни участники не знают структуры тестируемых белков до окончания стадии предсказаний.

Тестируемые белки — чаще всего ещё не разрешенные структуры, полученные методами рентгеноструктурного анализа и ЯМР. Также это могут быть уже разрешенные структуры, но не выложенные в Protein Data Bank.

Выбранные белки могут иметь гомологи по последовательности с известными структурами. Это может быть определено с помощью выравнивания последовательностей методами BLAST или HHsearch. Далее допускается моделирование структуры по гомологии.

Если же гомологи или их структуры отсутствуют, применяется метод предсказания структур de novo. Примером такого метода является Rosetta. На данный момент это направление применимо для небольших белков (не более 100—150 аминокислот). По этой причине категория полностью новых структур в CASP представлена мало.[2]

Основной метод оценки результатов — сравнение положений Сα-атомов предсказанных структур и целевой модели.

Сравнение визуализируется с помощью кумулятивного распределения расстояний между парами эквивалентных Сα-атомов в структурном выравнивании модели и структур. Пример показан на рисунке, целевая модель соответствует нулевому значению на графике.

Численная характеристика качества предсказания — GDT-TS (Global Distance Test — Total Score) . Она описывает процент хорошо смоделированных остатков предсказанной структуры.

De novo-предсказания оцениваются также группой экспертов, так как численные методы дают непоказательные результаты для сильно различающихся структур (а методы de novo с большей вероятностью дают неправильные структуры и являются самыми сложными для оценки).[3]

Самые точные предсказания могут оцениваться с помощью сравнения с кристаллом целевой структуры.[4]

Категории предсказаний

[править | править код]

Разные способы оценки могут использоваться для разных категорий:

  • предсказания третичной структуры белков (все CASP)
    • моделирование по гомологии
    • распознание укладки белка
    • de novo-предсказания
  • предсказания вторичной структуры (отсутствует после CASP5)
  • предсказание структурных комплексов (только CASP2, существует отдельный эксперимент CAPRI)
  • предсказание контактов между остатками (с CASP4)
  • предсказание неструктурированных участков (с CASP5)
  • предсказание функции (с CASP6)
  • оценка качества модели (с CASP7)
  • уточнение модели (с CASP7)
  • точное предсказание по образцу (с CASP7)

Результаты

[править | править код]

Результаты CASP публикуются в специальных выпусках журнала Proteins. Доступ к статьям возможен через официальный сайт CASP.[5]

Главная статья выпуска описывает сам эксперимент.[6] [7] Заключитальная статья выпуска посвящена развитию науки структурного моделирования.[8][9]

Примечания

[править | править код]
  1. Moult, J., et al. A large-scale experiment to assess protein structure prediction methods (англ.) // Proteins : journal. — 1995. — Vol. 23, no. 3. — P. ii—iv. — doi:10.1002/prot.340230303.
  2. Zhang Y and Skolnick J. The protein structure prediction problem could be solved using the current PDB library (англ.) // Proceedings of the National Academy of Sciences of the United States of America : journal. — 2005. — Vol. 102, no. 4. — P. 1029—1034. — doi:10.1073/pnas.0407152101. — PMID 15653774. — PMC 545829.
  3. Ben-David, M., et al. Assessment of CASP8 structure predictions for template free targets (англ.) // Proteins : journal. — 2009. — Vol. 77, no. Suppl 9. — P. 50—65. — doi:10.1002/prot.22591. — PMID 19774550.
  4. Read, R.J., Chavali, G. Assessment of CASP7 predictions in the high accuracy template-based modeling category (англ.) // Proteins : Structure, Function, and Bioinformatics[англ.] : journal. — 2007. — Vol. 69, no. Suppl 8. — P. 27—37. — doi:10.1002/prot.21662. — PMID 17894351.
  5. CASP Proceedings. Дата обращения: 11 декабря 2014. Архивировано 29 июня 2010 года.
  6. Moult, J., et al. Critical assessment of methods of protein structure prediction — Round VII (англ.) // Proteins : journal. — 2007. — Vol. 69, no. Suppl 8. — P. 3—9. — doi:10.1002/prot.21767. — PMID 17918729. — PMC 2653632.
  7. Moult, J., et al. Critical assessment of methods of protein structure prediction — Round VIII (англ.) // Proteins : journal. — 2009. — Vol. 77, no. Suppl 9. — P. 1—4. — doi:10.1002/prot.22589. — PMID 19774620.
  8. Kryshtafovych, A., et al. Progress from CASP6 to CASP7 (англ.) // Proteins : Structure, Function, and Bioinformatics[англ.] : journal. — 2007. — Vol. 69, no. Suppl 8. — P. 194—207. — doi:10.1002/prot.21769. — PMID 17918728.
  9. Kryshtafovych, A., et al. CASP8 results in context of previous experiments (неопр.) // Proteins. — 2009. — Т. 77, № Suppl 9. — С. 217—228. — doi:10.1002/prot.22562. — PMID 19722266.