AlphaFold

AlphaFold
Información general
Tipo de programa	Modelo de inteligencia artificial; Predicción de la estructura de las proteínas
Desarrollador	Google DeepMind
Modelo de desarrollo	Código abierto
Lanzamiento inicial	2018
Licencia	Apache 2.0 License
Información técnica
Programado en	Python
Versiones
Última versión estable	2.3.25 de abril de 2023
Enlaces
	Sitio web oficial Repositorio de código
	[editar datos en Wikidata]

AlphaFold es un programa de inteligencia artificial (IA) desarrollado por DeepMind de Alphabet que realiza predicciones de la estructura de las proteínas^[1] mediante el sistema de aprendizaje profundo.^[2]La primera versión de AlphaFold, conocida como AlphaFold 1, obtuvo el primer lugar en la clasificación general de la 13.ª edición de la competición CASP (Critical Assessment of Techniques for Protein Structure Prediction, 'evaluación crítica de técnicas para la predicción de la estructura de proteínas') en diciembre de 2018. El programa se destacó particularmente en las predicciones de estructuras para las que no existían modelos previos,^{[n. 1]} consideradas por los organizadores de la competición como las más difíciles.

AlphaFold 2, versión desarrollada en 2020, volvió a ganar la competición CASP en noviembre de 2020,^[3] con predicciones mucho más exactas que las de cualquier otro programa.^[2] En alrededor de dos tercios de las proteínas, AlphaFold 2 obtuvo una puntuación superior a 90 en la prueba de distancia global (GDT), que compara las predicciones de los programas con las estructuras determinadas experimentalmente; una puntuación de 100 denota una coincidencia completa.^[2]^[4]

Los resultados de AlphaFold 2 en CASP han sido calificados como «asombrosos»^[5] y «transformadores».^[6] Aunque la exactitud de las predicciones no es lo suficientemente alta en un tercio de los casos y el programa no revela ninguna información sobre el mecanismo del plegamiento de las proteínas,^[7]^[8] el logro técnico ha recibido un reconocimiento generalizado.

El 15 de julio de 2021, Nature publicó un artículo sobre AlphaFold2 junto con software de código abierto y una base de datos de búsqueda de proteomas de varias especies.^[9]^[10]^[11]^[12]

El problema del plegamiento de las proteínas

Las proteínas están formadas por cadenas de aminoácidos que se doblan y acoplan entre sí espontáneamente, en un proceso llamado plegamiento de proteínas, para formar una estructura tridimensional (3-D) relacionada con la función biológica de la proteína. Uno de los desafíos de la biología molecular, conocido como el «problema del plegamiento de las proteínas» consiste en entender cómo la secuencia de aminoácidos determina la estructura tridimensional.^[13] Para solucionar este problema, es necesario comprender la termodinámica de las fuerzas interatómicas que resultan en una estructura estable y el mecanismo por el que las proteínas alcanzan su configuración final con extrema rapidez.^[14]

Las estructuras de las proteínas se determinan habitualmente de forma experimental mediante métodos como la cristalografía de rayos X, la microscopía crioelectrónica y la resonancia magnética nuclear, técnicas que son costosas y pueden requerir mucho tiempo.^[13] Durante los últimos sesenta años se han identificado las estructuras de unas 170 000 proteínas, una mera fracción de las proteínas existentes en todas las formas de vida que se calculan en más de doscientos millones.^[4] El poder predecir la estructura de las proteínas sin más información que la secuencia de aminoácidos sería de gran ayuda para avanzar en la investigación científica. Sin embargo, la paradoja de Levinthal muestra que, si bien una proteína se puede plegar en milisegundos, el tiempo que lleva calcular todas las estructuras posibles al azar para determinar la estructura es más largo que la edad del universo conocido.^[13]

A lo largo de los años, los investigadores han aplicado numerosos métodos computacionales al problema de la predicción de la estructura de las proteínas, pero la precisión de los modelos generados jamás se había acercado a la de las estructuras determinadas por técnicas experimentales, excepto para proteínas pequeñas y simples. Hasta la entrada en escena de AlphaFold con su técnica de inteligencia artificial (IA) basada en el aprendizaje profundo,^[13] los mejores algoritmos usados en CASP, solo producían estructuras comparables a las determinadas experimentalmente en un 40 % de los casos más difíciles.^[4]

Algoritmo

DeepMind ha entrenado el programa AlphaFold con más de 170 000 proteínas de los depósitos públicos de secuencias y estructuras de proteínas. El programa utiliza una forma de red de atención, una técnica de aprendizaje profundo que identifica partes de un problema mayor y luego las junta para obtener la solución general.^[2] El entrenamiento del algoritmo empleó entre cien y doscientas unidades de procesamiento gráfico (GPU),^[2] y tomó «algunas semanas». El programa necesita unos días para predecir una estructura.^[15]

AlphaFold 1 (2018)

AlphaFold 1 se basó en el trabajo de varios equipos, que durante la década de 2010 examinaron las secuencias de ADN de proteínas relacionadas en organismos diferentes —la mayoría sin una estructura tridimensional conocida— para tratar de encontrar cambios correlacionados en la lista de aminoácidos, es decir, casos en que mutaciones en dos o más lugares coincidan en proteínas homólogas de distintas especies. Los investigadores dedujeron que tales correlaciones pueden deberse a que los aminoácidos mutados formen contactos en la proteína, aunque no ocupen lugares contiguos en la secuencia de ADN, lo que permite elaborar un mapa de posibles contactos en la estructura. AlphaFold 1 se basó en esta idea para calcular una distribución de probabilidad de las distancias entre los aminoácidos y convertir el mapa de contactos en un mapa de distancias probables y predecir la estructura mediante la optimización de un potencial estadístico basado en esta distribución de probabilidad.^[16]

AlphaFold 2 (2020)

El equipo de DeepMind descubrió que su método anterior tenía la tendencia de sobrevalorar las interacciones entre los aminoácidos cercanos en la secuencia en comparación con los más alejados. Como resultado, AlphaFold 1 predecía modelos en los que la estructura secundaria (hélices alfa y hojas beta) predominaba excesivamente.^[17] AlphaFold 1 constaba de varios módulos, cada uno entrenado por separado, utilizados para producir un potencial guía que luego se combinaba con el potencial energético basado en cálculos de física. AlphaFold 2 reemplazó esto con un sistema de subredes acopladas en un único modelo basado completamente en el reconocimiento de patrones, entrenado como una única estructura integrada.^[18]^[19] El refinamiento de la energía se aplica solo como un paso del refinamiento final una vez que la predicción de la red neuronal ha convergido, y solo ajusta ligeramente la estructura predicha.^[17]

Una parte clave del sistema de 2020 consiste en dos módulos, probablemente basados en un modelo de transformador, que se utilizan para refinar progresivamente un vector de información para cada relación —o «borde» en la terminología de la teoría de grafos— 1) entre dos aminoácidos de la proteína y 2) entre cada posición de aminoácido y cada secuencia en el alineamiento de secuencias.^[19] Internamente, este proceso de refinamiento tiene el efecto de reunir datos relevantes y filtrar datos irrelevantes (el «mecanismo de atención») para estas relaciones, de una manera dictada por los datos de entrenamiento. Estas transformaciones se repiten de manera que la información actualizada al final de una iteración se convierte en los datos de entrada de la siguiente; en cada paso, la información de la relación aminoácido-aminoácido mejorada sirve para actualizar la información de la relación residuo-secuencia, y viceversa.^[19] A medida que avanza la iteración, según un informe, el «algoritmo de atención ... imita la forma en que una persona podría armar un rompecabezas: primero conectando piezas en pequeños grupos, en este caso grupos de aminoácidos, y luego buscando formas de unir los grupos en un todo más grande».^[4]

El resultado de estas iteraciones provee la información para la predicción final del módulo de predicción de la estructura,^[19] que también usa transformadores.^{[n. 2]} En un ejemplo presentado por DeepMind, el módulo de predicción de la estructura logró una topología correcta para la proteína en su primera iteración, que recibió una puntuación de 78 en la prueba de distancia global (GDT), pero con un 90 % de violaciones estereoquímicas, es decir, ángulos o longitudes de enlace no permitidos. En las iteraciones posteriores, el número de violaciones estereoquímicas disminuyó. En la tercera iteración, el GDT de la predicción era casi 90, y en la octava iteración el número de violaciones estereoquímicas se acercaba a cero.^[19]

El equipo de AlphaFold declaró en noviembre de 2020 que sería posible introducir cambios para mejorar la precisión.^[20]

Competiciones

CASP13

En diciembre de 2018, AlphaFold 1 ocupó el primer lugar en la clasificación general de la 13.ª Evaluación crítica de técnicas para la predicción de la estructura de proteínas (CASP).^[21]^[22]

El programa era capaz de predecir más correctamente las estructuras consideradas más difíciles por los organizadores, para las que no había estructuras de proteínas con una secuencia parcialmente similar. AlphaFold generó la mejor predicción para 25 de 43 proteínas en esta clase,^[22]^[23]^[24] logrando una puntuación media de 58,9 en la prueba de distancia global por delante de los 52,5 y 52,4 obtenidos por los siguientes mejores equipos,^[25] que también utilizaban el aprendizaje profundo para estimar las distancias de contacto.^[26]^[27] La puntuación general de AlphaFold en todos los objetivos fue de 68,5.^[28]

En enero de 2020, se publicó código de demostración de AlphaFold 1 como código abierto en GitHub,^[29]^[13] pero, como se indica en el archivo de instrucciones adjunto, solo se puede utilizar para los datos de CASP13, y no para predecir la estructura de cualquier proteína.

CASP14

En noviembre de 2020, la nueva versión de DeepMind, AlphaFold 2, ganó CASP14,^[15]^[30] con los mejores resultados en 88 de las 97 predicciones. En la medida de distancia global (GDT), el programa logró una puntuación media de 92,4 sobre 100,^{[n. 3]} un nivel de precisión comparable al obtenido experimentalmente con la cristalografía de rayos X.^[20]^[6]^[28] Dos años antes, en CASP13, AlphaFold 1 solo había alcanzado este nivel de en dos de todas sus predicciones; en 2020, 88 % de las predicciones obtuvieron una puntuación media de más de 80, que ascendió a 87 en los casos clasificados como difíciles.

En lo que concierne a la raíz del error cuadrático medio (RMSD) de la posición de los átomos de carbono alfa de la cadena principal de la proteína, cantidad muy sensible a las desviaciones atípicas muy amplias, el 88 % de las predicciones de AlphaFold 2 tenían un valor de 4 Å. Un 76 % y 46 % de las predicciones lograron RMSD menores de 3 y 2 Å respectivemente. La RMSD media de las predicciones fue de 2,1 Å.^[5] AlphaFold 2 también logró predicciones correctas para las cadenas laterales de los aminoácidos

Los modelos generados por AlphaFold 2 sirvieron además para determinar cuatro estructuras que hasta entonces no se habían podido elucidar de novo con métodos experimentales.^[31] Una de ellas era la de la Af1503, una proteína de membrana estudiada durante diez años.^[4] En estos cuatro casos, los modelos de AlphaFold se usaron como punto de partida para el método de reemplazo molecular, que requiere una similitud estructural entre el modelo y la estructura real.^[31]

De las tres peores predicciones de AlphaFold, dos de las estructuras pudieron obtenerse por espectroscopia mediante resonancia magnética nuclear de proteínas (RMN), a partir de una solución acuosa, mientras que AlphaFold se entrenó principalmente en estructuras cristalinas. La tercera proteína existe como un complejo multidominio de 52 copias idénticas del mismo dominio, un caso que para el que AlphaFold no estaba programado. En todos los casos con un solo dominio, excluyendo solo una proteína muy grande y las dos estructuras determinadas por RMN, AlphaFold 2 logró una puntuación GDT de más de 80.^[32]

Reacciones

AlphaFold 2 se considera un logro significativo en biología computacional y un gran progreso en el campo de la predicción de estructuras a partir de la secuencia de aminoácidos.^[4]^[6] El Premio Nobel de Química y biólogo estructural Venki Ramakrishnan ha descrito los resultados como «un avance asombroso en el problema del plegamiento de proteínas», y predijo que «cambiará fundamentalmente la investigación biológica».^[15]

A raíz de los comunicados de prensa de CASP y DeepMind,^[33]^[15] AlphaFold 2 recibió una amplia atención en los medios. Además de las noticias en la prensa científica especializada, como Nature,^[6] Science,^[4] MIT Technology Review,^[2] y New Scientist,^[34]^[35] la historia apareció en la prensa generalista,^[36]^[37]^[38]^[39] así como servicios de noticias y publicaciones semanales, como Fortune,^[40]^[18] The Economist,^[20] Bloomberg,^[28] Der Spiegel,^[41] y The Spectator .^[42] En Londres, The Times publicó la historia en la portada, con dos páginas adicionales de cobertura interna y un editorial.^[43] Un comentario frecuente en todas las publicaciones es que la capacidad de predecir las estructuras de proteínas con exactitud, beneficiará a la investigación en el área de las ciencias de la vida, facilitará el proceso de descubrimiento de nuevos fármacos y ayudará a entender la causa de las enfermedades.^[6]

Transparencia y accesibilidad

Una de las principales críticas a AlphaFold es la falta de transparencia. El líder del proyecto, John Jumper, hizo una presentación de 30 minutos sobre AlphaFold 2 durante la conferencia CASP14, descrita como «llena de ideas e insinuaciones, pero casi completamente desprovista de detalles».^[44] A diferencia de las presentaciones de otros grupos de investigación que tomaron parte en CASP14, la de DeepMind no fue grabada y no está disponible públicamente. En declaraciones a El País, el investigador Alfonso Valencia dijo: «Lo más importante que nos deja este avance es saber que este problema [el plagamiento de las proteínas] tiene solución, que es posible resolverlo [...] Google no proporciona el software y esta es la parte frustrante del logro porque no beneficiará directamente a la ciencia».^[39] Sin embargo, simplemente saber lo que DeepMind ha logrado puede incentivar a otros equipos a desarrollar sistemas de IA similares.^[39] A fines de 2019, DeepMind publicó una gran parte de la primera versión de AlphaFold como código abierto; pero solo cuando AlphaFold 2, mucho más potente, se encontraba en una fase avanzada de desarrollo. La preocupación por una posible falta de transparencia por parte de DeepMind se ha puesto en contraste con la labor de cinco décadas para elucidar las estructuras de miles de proteínas y almacenarlas en el Banco de Datos de Proteínas financiado principalmente con recursos públicos, al igual que otros repositorios abiertos de secuencias de ADN. Sin los resultados de este trabajo, públicamente accesibles, el éxito de AlphaFold 2 no hubiera sido posible.^[45]^[46]^[47]

Un investigador del grupo de Informática de Proteínas de Oxford ha resaltado que el éxito de AlphaFold se debe en parte a una ingente infraestructura computacional, a la que pocos grupos científicos pueden optar, y apunta a un futuro en el que los investigadores académicos no podrían llevar a cabo investigación en campos competitivos más que formando consorcios «de la misma meneral que los físicos de partículas tuvieron que unirse para construir proyectos enormes como CERN».^[48]

Con tan poco conocimiento sobre el funcionamiento interno de AlphaFold 2 se ha cuestionado su capacidad para identificar pliegues poco representados en las estructuras existentes en las bases de datos.^[7]^[49] También se desconoce hasta qué punto las estructuras de proteínas en tales bases de datos, en su mayoría de proteínas en estado cristalino, son representativas de proteínas no cristalizables o de las estructuras adoptadas por las mismas proteínas en condiciones fisiológicas en las células vivas. Las discrepancias entre las predicciones de AlphaFold 2 y las estructuras obtenidas mediante RMN pueden ser una señal de dificultades es esta área.

Greg Bowman, colaborador de Folding@home señaló que incluso una respuesta perfecta al problema de la predicción de proteínas no sería suficiente para comprender en detalle cómo el proceso de plegamiento ocurre realmente en la naturaleza —y cómo a veces las proteínas también pueden plegarse mal.^[50]

Predicciones de complejos moleculares y estructuras con cofactores

No está claro hasta qué punto las predicciones de AlphaFold 2 serán válidas para proteínas en complejos con otras proteínas y moléculas,^[49] puesto que AlphaFold no estaba diseñada para este caso. Precisamente fue en las predicciones de estructuras de proteínas con interacciones fuertes con otras copias de sí mismas o con otras estructuras donde AlphaFold 2 tuvo peores resultados. Dado que la maquinaria biológica de la célula se basa en gran parte en tales complejos, o en modificaciones de las proteínas al entrar en contacto con otras moléculas, esta es un área que todavía es un desafío para los programas de predicción de estructuras.^[49]

Además, debido a que AlphaFold solo funciona con proteínas, no considera los efectos en la estructura de otras biomoléculas asociadas. Elisa Fadda (Maynooth University, Irlanda) y Jon Agirre (University of York, Reino Unido) destacaron el impacto de la ausencia en los modelos AlphaFold de metales, cofactores y, más visiblemente, modificaciones co y postraduccionales como la glicosilación de proteínas. En estos casos, los científicos deben buscar en bases de datos como UniProt-KB posibles componentes ausentes del modelo, ya que estas pueden desempeñar un papel importante no solo en el plegamiento sino también en la función de las proteínas.^[51] Sin embargo, los autores comentaron que muchos de los modelos de AlphaFold eran lo suficientemente precisos como para permitir la introducción de modificaciones a posteriori.^[51]

Descubrimiento de fármacos

Para que un modelo sea útil para el descubrimiento de fármacos, el error de la estructura en las partes de la proteína que conforman los sitios de unión no debe superar los 0,3 Å, pero las predicciones de AlphaFold 2 solo alcanzaban una rmsd de 0,9 Å para todos los átomos, lo que limitan su utilidad en tales contextos.^[7]^[49] Un problema fundamental en el desarrollo de nuevos fármacos, según el columnista de Science Derek Lowe y el autor de libros de ciencia Philip Ball, no es la capacidad de determinar la estructura de las «proteínas diana», sino la dificultad de determinar si realmente son dianas apropiadas —es decir, si su papel biológico en un proceso patológico es tal que su inhibición por los nuevos medicamentos frena la enfermedad sin efectos adversos inaceptables—. Esta información no es siempre dada por el conocimiento de la estructura. El desarrollo de mejores modelos para el estudio de las enfermedades y la determinación de la toxicidad de los fármacos antes de los estudios clínicos en seres humanos serían una prioridad mayor que la determinación estructural.^[52]^[53]^[54]

Base de datos

La base de datos de estructuras de proteínas generadas por AlphaFold (AlphaFold DB) se publicó el 22 de julio de 2021 conjuntamente por AlphaFold y el Instituto Europeo de Bioinformática. En el momento de la publicación, la base de datos contenía predicciones de estructuras de casi todo el proteoma humano en UniProt y veinte organismos modelo, lo que equivale a más de 365 000 proteínas. En julio de 2021, UniProt-KB e InterPro comenzaron a actualizarse para mostrar las predicciones de AlphaFold a medida que estén disponibles.^[55]^[56] La base de datos no incluye proteínas con menos de 16 o más de 2700 residuos de aminoácidos, excepto en el caso de proteínas humanas, donde todas las predicciones se encuentran en el archivo.^[57] El objetivo inicial de AlphaFold DB para comienzos del año 2022 era añadir más secuencias a la base de datos hasta cubrir la mayor parte de las secuencias de UniRef90, la cual contiene más de 100 millones de proteínas.^[58] A fecha de 15 de mayo de 2022, 992 316 predicciones estaban disponibles en la base de datos.^[59]

En julio de 2021, UniProt-KB e InterPro se actualizaron para mostrar predicciones de AlphaFold DB disponibles.^[60]

El 28 de julio de 2022, AlphaFold DB se actualizó añadiendo estructuras de aproximadamente 200 millones de proteínas procedentes de 1 millón de especies, abarcando casi todas las proteínas conocidas en la Tierra.^[61]

Limitaciones

La base de datos utiliza un modelo monomérico, similar a la versión CASP14. Debido a esto, presenta muchas de las mismas limitaciones:^[62]

AlphaFold DB solo predice monómeros, perdiendo cierto contexto de estructuras como complejos proteicos. Existe una versión de AlphaFold Multimer, para polímeros, publicada y de acceso libre, pero no hay modelos de entrenamiento del algoritmo disponibles.
El modelo presenta baja confianza para las proteínas intrínsecamente desestructuradas, aunque es posible comprobar el nivel de confianza para cada predicción.
El modelo no está validado para análisis de mutaciones.
El modelo solo genera una estructura de proteínas, con múltiples conformaciones, sin poder comprobar qué conformación escoge.
Solo predice la cadena principal de péptidos, pero no las estructuras acompañantes de cofactores, metales y modificaciones post-traduccionales. En octubre de 2021, un grupo de investigadores envió una carta al editor de Nature Structural & Molecular Biology para sugerir que la base de datos se completara gradualmente con estas estructuras faltantes.^[51] Esto genera problemas para el estudio de sistemas biológicos relevantes. Por ejemplo, entre el 50 % y el 70 % de las estructuras del proteoma humano están incompletas si no se incluyen los glucanos unidos covalentemente.^[63] Por otra parte, debido a que el modelo se entrena a partir de estructuras extraídas del Protein Data Bank (PDB), las cuales frecuentemente incluyen estas estructuras adicionales incluidas, las predicciones de AlphaFold son "frecuentemente consistentes con la estructura esperada incluyendo la presencia de iones y cofactores.^[62]

Aplicaciones

AlphaFold se ha utilizado para predecir varias estructuras de proteínas del SARS-CoV-2, el agente causante de la COVID-19. A raíz de la pandemia, existe un gran interés en la determinación experimental de las estructuras de estas proteínas desde principios de 2020.^[64]^[6] Un equipo de científicos del Instituto Francis Crick en el Reino Unido examinó las predicciones antes de publicarlas para la comunidad entera de investigadores. El equipo reconoció que, aunque las estructuras podrían no ser necesarias para las investigaciones terapéuticas en curso, ayudarían a entender mejor la biología del virus.^[65] También confirmaron que la estructura de la proteína ORF3a predicha por AlphaFold 2 se asemejaban mucho la estructura determinada por microscopía crioelectrónica en la Universidad de California, Berkeley. Esta proteína ayuda a los virus replicados a salir de la célula huésped y se piensa que participa en el desencadenamiento de la respuesta inflamatoria a la infección.^[66]

Véase también

Notas

↑ Estos modelos se basan en las estructuras de terminadas experimentalmente de proteínas con una secuencia parcialmente similar.
↑ El módulo de predicción de la estructura usa una arquitectura de «transformador 3D equivariante».^[19]
↑ Para conseguir una puntuación de 92,5, al menos 70 % de la estructura debe ser correcta dentro de una precisión de 1 Å y, al menos 85 %, a una precisión de 2 Å.

Referencias

↑ «AlphaFold». Deepmind (en inglés). Consultado el 30 de noviembre de 2020.
↑ ^a ^b ^c ^d ^e ^f «DeepMind's protein-folding AI has solved a 50-year-old grand challenge of biology». MIT Technology Review (en inglés). Consultado el 30 de noviembre de 2020.
↑ Shead, Sam (30 de noviembre de 2020). «DeepMind solves 50-year-old 'grand challenge' with protein folding A.I.» (en inglés). p. CNBC. Consultado el 30 de noviembre de 2020.
↑ ^a ^b ^c ^d ^e ^f ^g Service, Robert F. (2020-11-30 30). «‘The game has changed.’ AI triumphs at solving protein structures». Science (en inglés).
↑ ^a ^b AlQuraishi, Mohammed (30 de noviembre de 2020). «CASP14 scores just came out and they’re astounding». twitter (en inglés).
↑ ^a ^b ^c ^d ^e ^f Callaway, Ewen (30 de noviembre de 2020). «'It will change everything': DeepMind's AI makes gigantic leap in solving protein structures». Nature (en inglés) 588 (7837): 203-204. Bibcode:2020Natur.588..203C. PMID 33257889. doi:10.1038/d41586-020-03348-4.
↑ ^a ^b ^c Stephen Curry, No, DeepMind has not solved protein folding, Reciprocal Space (blog), 2 de diciembre de 2020
↑ Balls, Phillip (9 de diciembre de 2020). «Behind the screens of AlphaFold». Chemistry World (en inglés).
↑ Jumper, John; Evans, Richard; Pritzel, Alexander; Green, Tim; Figurnov, Michael; Ronneberger, Olaf; Tunyasuvunakool, Kathryn; Bates, Russ et al. (15 de julio de 2021). «Highly accurate protein structure prediction with AlphaFold». Nature (en inglés) 596 (7873): 583-589. PMC 8371605. PMID 34265844. doi:10.1038/s41586-021-03819-2.
↑ «GitHub - deepmind/alphafold: Open source code for AlphaFold.». GitHub (en inglés). Consultado el 24 de julio de 2021.
↑ «AlphaFold Protein Structure Database». alphafold.ebi.ac.uk. Consultado el 24 de julio de 2021.
↑ Bourne P.E.; Draizen E.J,; Mura C. (2022). «The curse of the protein ribbon diagram.». PLoS Biology 20 (12): e3001901. doi:10.1371/journal.pbio.3001901. Consultado el 30 de enero de 2023.
↑ ^a ^b ^c ^d ^e «AlphaFold: Using AI for scientific discovery». Deepmind (en inglés). Consultado el 30 de noviembre de 2020.
↑ Ken A. Dill, S. Banu Ozkan, M. Scott Shell, and Thomas R. Weikl (2008). «The Protein Folding Problem». Annual Review of Biophysics (en inglés) 37: 289-316. PMC 2443096. PMID 18573083. doi:10.1146/annurev.biophys.37.092707.153558.
↑ ^a ^b ^c ^d «AlphaFold: a solution to a 50-year-old grand challenge in biology». Deepmind (en inglés). Consultado el 30 de noviembre de 2020.
↑ «AlphaFold: Machine learning for protein structure prediction». Foldit (en inglés). 31 de enero de 2020.
↑ ^a ^b John Jumper et al., conference abstract (December 2020)
↑ ^a ^b Kahn, Jeremy (1 de diciembre de 2020). «Lessons from DeepMind's breakthrough in protein-folding A.I.». Fortune.
↑ ^a ^b ^c ^d ^e ^f Jumper, John et al. (1 d diciembre de 2020). AlphaFold2 (en inglés).
↑ ^a ^b ^c «DeepMind is answering one of biology's biggest challenges». The Economist (en inglés). 30 de noviembre de 2020. ISSN 0013-0613. Consultado el 30 de noviembre de 2020.
↑ «Group performance based on combined z-scores» (en inglés). CASP 13. diciembre de 2018.
↑ ^a ^b Sample, Ian (2 de diciembre de 2018). «Google's DeepMind predicts 3D shapes of proteins». The Guardian (en inglés).
↑ «AlphaFold: Using AI for scientific discovery». Deepmind. Consultado el 30 de noviembre de 2020.
↑ Singh, Arunima (2020). «Deep learning 3D structures». Nature Methods (en inglés) 17 (3): 249. ISSN 1548-7105. PMID 32132733. doi:10.1038/s41592-020-0779-y.
↑ «CASP 13 data tables» (en inglés). CASP.
↑ Wei Zheng et al,Deep-learning contact-map guided protein structure prediction in CASP13, Proteins: Structure, Function, and Bioinformatics, 87(12) 1149–1164 doi 10.1002/prot.25792; and slides
↑ Hou, Jie; Wu, Tianqi; Cao, Renzhi; Cheng, Jianlin (25 de abril de 2019). «Protein tertiary structure modeling driven by deep learning and contact distance prediction in CASP13». Proteins: Structure, Function, and Bioinformatics (Wiley) 87 (12): 1165-1178. ISSN 0887-3585. doi:10.1002/prot.25697.
↑ ^a ^b ^c «DeepMind Breakthrough Helps to Solve How Diseases Invade Cells» (en inglés). 30 de noviembre de 2020. Consultado el 30 de noviembre de 2020.
↑ «deepmind/deepmind-research». GitHub (en inglés). Consultado el 30 de noviembre de 2020.
↑ «DeepMind's protein-folding AI has solved a 50-year-old grand challenge of biology». MIT Technology Review (en inglés). Consultado el 30 de noviembre de 2020.
↑ ^a ^b Andriy Kryshtafovych (30 November 2020), Experimentalists: Are models useful?
↑ Lisa Kinch et al, CASP14 Tertiary Structure Prediction Assessment:Topology (FM) Category (CASP 14 presentation)
↑ Artificial intelligence solution to a 50-year-old science challenge could ‘revolutionise’ medical research (press release), CASP organising committee, 30 November 2020
↑ Le Page, Michael (30 de noviembre de 2020). «DeepMind's AI biologist can decipher secrets of the machinery of life». New Scientist (en inglés).
↑ «The predictions of DeepMind’s latest AI could revolutionise medicine». New Scientist (en inglés). 2 de diciembre de 2020.
↑ Metz, Cade (30 de noviembre de 2020). «London A.I. Lab Claims Breakthrough That Could Accelerate Drug Discovery». New York Times (en inglés).
↑ Sample, Ian (30 de noviembre de 2020). «DeepMind AI cracks 50-year-old problem of protein folding». The Guardian (en inglés).
↑ Roberts, Lizzie (30 de noviembre de 2020). «"Once in a generation advance" as Google AI researchers crack 50-year-old biological challenge». Daily Telegraph (en inglés).
↑ ^a ^b ^c Domínguez, Nuño (2 de diciembre de 2020). «La inteligencia artificial arrasa en uno de los problemas más importantes de la biología». El País.
↑ Kahn, Jeremy (30 de noviembre de 2020). «In a major scientific breakthrough, A.I. predicts the exact shape of proteins». Fortune (en inglés).
↑ Merlot, Julia (2 de diciembre de 2020). «Forscher hoffen auf Durchbruch für die Medikamentenforschung». Der Spiegel (en alemán).
↑ Al-Lazikani, Bissan (1 de diciembre de 2020). «The solving of a biological mystery]». The Spectator (en inglés).
↑ Whipple, Tom (30 de noviembre de 2020). «Deepmind finds biology’s ‘holy grail’ with answer to protein problem». The Times (en inglés).
↑ AlQuraishi, Mohammed (8 de diciembre de 2020). «AlphaFold2 @ CASP14: "It feels like one's child has left home." The Method». Some Thoughts on a Mysterious Universe (en inglés). Consultado el 15 de diciembre de 2020.
↑ Edwards, Aled (5 de diciembre de 2020). «The AlphaFold2 success: It took a village» (en inglés). Structural Genomics Consortium.
↑ Briggs, David (4 de diciembre de 2020). «If Google’s Alphafold2 really has solved the protein folding problem, they need to show their working». The Skeptic (UK) (en inglés).
↑ «The Guardian view on DeepMind’s brain: the shape of things to come». The Guardian (en inglés). 6 de diciembre de 2020.
↑ Outeiral, Carlos (3 de diciembre de 2020). «CASP14: what Google DeepMind’s AlphaFold 2 really achieved, and what it means for protein folding, biology and bioinformatics» (en inglés). Oxford Protein Informatics Group.
↑ ^a ^b ^c ^d Ireland, Tom (4 de diciembre de 2020). «How will AlphaFold change bioscience research?». The Biologist (en inglés). Royal Society of Biology.
↑ Bowman, Greg (8 de diciembre de 2020). Protein folding and related problems remain unsolved despite AlphaFold's advance (en inglés). Folding@home.
↑ ^a ^b ^c Bagdonas, Haroldas; Fogarty, Carl A.; Fadda, Elisa; Agirre, Jon (29 de octubre de 2021). «The case for post-predictional modifications in the AlphaFold Protein Structure Database». Nature Structural & Molecular Biology (en inglés): 1-2. ISSN 1545-9985. doi:10.1038/s41594-021-00680-9.
↑ Lowe, Derek (25 de septiembre de 2019). «In the Pipeline: What’s Crucial And What Isn’t». Science Translational Medicine (en inglés).
↑ Ball, Philip (9 de diciembre de 2020). «Behind the Screens of AlphaFold». Chemistry World (en inglés).
↑ Lowe, Derek (1 de diciembre de 2020). «In the Pipeline: The Big Problems». Science Translational Medicine (en inglés).
↑ «Alphafold Structure Predictions Available In Interpro». proteinswebteam.github.io (en inglés). InterPro. Consultado el 29 de julio de 2021.
↑ «Putting the power of AlphaFold into the world's hands». Deepmind (en inglés).
↑ «AlphaFold Protein Structure Database». alphafold.ebi.ac.uk. Consultado el 29 de julio de 2021.
↑ Mihaly Varadi, Stephen Anyango, Mandar Deshpande, Sreenath Nair, Cindy Natassia, Galabina Yordanova, David Yuan, Oana Stroe, Gemma Wood, Agata Laydon, Augustin Žídek, Tim Green, Kathryn Tunyasuvunakool, Stig Petersen, John Jumper, Ellen Clancy, Richard Green, Ankur Vora, Mira Lutfi, Michael Figurnov, Andrew Cowie, Nicole Hobbs, Pushmeet Kohli, Gerard Kleywegt, Ewan Birney, Demis Hassabis, Sameer Velankar (January 2022). «AlphaFold Protein Structure Database: massively expanding the structural coverage of protein-sequence space with high-accuracy models». Nucleic Acids Research (en inglés) 50 (1): D439-D444. doi:10.1093/nar/gkab1061. Consultado el 4-8-2022.
↑ «AlphaFold Protein Structure Database». www.alphafold.ebi.ac.uk (en inglés). Consultado el 3 de agosto de 2022.
↑ «Putting the power of AlphaFold into the world’s hands». www.deepmind.com (en inglés). Consultado el 3 de agosto de 2022.
↑ Callaway, Ewen (28 de julio de 2022). «‘The entire protein universe’: AI predicts shape of nearly every known protein». Nature (en inglés) 608 (7921): 15-16. doi:10.1038/d41586-022-02083-2. Consultado el 3 de agosto de 2022.
↑ ^a ^b «What use cases does AlphaFold not support?». www.alphafold.ebi.ac.uk (en inglés). Consultado el 3 de agosto de 2022.
↑ An, Hyun Joo; Froehlich, John W; Lebrilla, Carlito B (1 de octubre de 2009). «Determination of glycosylation sites and site-specific heterogeneity in glycoproteins». Current Opinion in Chemical Biology. Analytical Techniques/Mechanisms (en inglés) 13 (4): 421-426. ISSN 1367-5931. doi:10.1016/j.cbpa.2009.07.022.
↑ «AI Can Help Scientists Find a Covid-19 Vaccine» (en inglés). ISSN 1059-1028. Consultado el 1 de diciembre de 2020.
↑ «Computational predictions of protein structures associated with COVID-19». Deepmind (en inglés). Consultado el 1 de diciembre de 2020.
↑ «How DeepMind's new protein-folding A.I. is already helping to combat the coronavirus pandemic.». Fortune (en inglés). Consultado el 1 de diciembre de 2020.

Enlaces externos

AlphaFold en GitHub.

Predicciones de AlphaFold en el European Bioinformatics Institute
Esta obra contiene una traducción parcial derivada de «AlphaFold» de Wikipedia en inglés, concretamente de esta versión, publicada por sus editores bajo la Licencia de documentación libre de GNU y la Licencia Creative Commons Atribución-CompartirIgual 4.0 Internacional.
[Artículo en Nature sobre AlphaFold](https://www.nature.com/articles/s41586-024-07487-w)

Datos: Q60827595
Multimedia: AlphaFold / Q60827595

[3] Estos modelos se basan en las estructuras de terminadas experimentalmente de proteínas con una secuencia parcialmente similar.

[21] El módulo de predicción de la estructura usa una arquitectura de «transformador 3D equivariante».^[19]

[33] Para conseguir una puntuación de 92,5, al menos 70 % de la estructura debe ser correcta dentro de una precisión de 1 Å y, al menos 85 %, a una precisión de 2 Å.

[1] «AlphaFold». Deepmind (en inglés). Consultado el 30 de noviembre de 2020.

[mittr20201130-2] ↑ ^a ^b ^c ^d ^e ^f «DeepMind's protein-folding AI has solved a 50-year-old grand challenge of biology». MIT Technology Review (en inglés). Consultado el 30 de noviembre de 2020.

[cnbc20201130-4] Shead, Sam (30 de noviembre de 2020). «DeepMind solves 50-year-old 'grand challenge' with protein folding A.I.» (en inglés). p. CNBC. Consultado el 30 de noviembre de 2020.

[science20201130-5] ↑ ^a ^b ^c ^d ^e ^f ^g Service, Robert F. (2020-11-30 30). «‘The game has changed.’ AI triumphs at solving protein structures». Science (en inglés).

[AlQuraishiTweet-6] AlQuraishi, Mohammed (30 de noviembre de 2020). «CASP14 scores just came out and they’re astounding». twitter (en inglés).

[:5-7] ↑ ^a ^b ^c ^d ^e ^f Callaway, Ewen (30 de noviembre de 2020). «'It will change everything': DeepMind's AI makes gigantic leap in solving protein structures». Nature (en inglés) 588 (7837): 203-204. Bibcode:2020Natur.588..203C. PMID 33257889. doi:10.1038/d41586-020-03348-4.

[curry-8] Stephen Curry, No, DeepMind has not solved protein folding, Reciprocal Space (blog), 2 de diciembre de 2020

[9] Balls, Phillip (9 de diciembre de 2020). «Behind the screens of AlphaFold». Chemistry World (en inglés).

[nature20210715-10] Jumper, John; Evans, Richard; Pritzel, Alexander; Green, Tim; Figurnov, Michael; Ronneberger, Olaf; Tunyasuvunakool, Kathryn; Bates, Russ et al. (15 de julio de 2021). «Highly accurate protein structure prediction with AlphaFold». Nature (en inglés) 596 (7873): 583-589. PMC 8371605. PMID 34265844. doi:10.1038/s41586-021-03819-2.

[11] «GitHub - deepmind/alphafold: Open source code for AlphaFold.». GitHub (en inglés). Consultado el 24 de julio de 2021.

[12] «AlphaFold Protein Structure Database». alphafold.ebi.ac.uk. Consultado el 24 de julio de 2021.

[13] Bourne P.E.; Draizen E.J,; Mura C. (2022). «The curse of the protein ribbon diagram.». PLoS Biology 20 (12): e3001901. doi:10.1371/journal.pbio.3001901. Consultado el 30 de enero de 2023.

[:3-14] «AlphaFold: Using AI for scientific discovery». Deepmind (en inglés). Consultado el 30 de noviembre de 2020.

[15] Ken A. Dill, S. Banu Ozkan, M. Scott Shell, and Thomas R. Weikl (2008). «The Protein Folding Problem». Annual Review of Biophysics (en inglés) 37: 289-316. PMC 2443096. PMID 18573083. doi:10.1146/annurev.biophys.37.092707.153558.

[DeepMindAlpha2-16] «AlphaFold: a solution to a 50-year-old grand challenge in biology». Deepmind (en inglés). Consultado el 30 de noviembre de 2020.

[17] «AlphaFold: Machine learning for protein structure prediction». Foldit (en inglés). 31 de enero de 2020.

[Alpha2Abstract-18] John Jumper et al., conference abstract (December 2020)

[KahnLessons-19] Kahn, Jeremy (1 de diciembre de 2020). «Lessons from DeepMind's breakthrough in protein-folding A.I.». Fortune.

[block_diagram-20] ↑ ^a ^b ^c ^d ^e ^f Jumper, John et al. (1 d diciembre de 2020). AlphaFold2 (en inglés).

[economist20201130-22] «DeepMind is answering one of biology's biggest challenges». The Economist (en inglés). 30 de noviembre de 2020. ISSN 0013-0613. Consultado el 30 de noviembre de 2020.

[23] «Group performance based on combined z-scores» (en inglés). CASP 13. diciembre de 2018.

[Guardian2018-24] Sample, Ian (2 de diciembre de 2018). «Google's DeepMind predicts 3D shapes of proteins». The Guardian (en inglés).

[25] «AlphaFold: Using AI for scientific discovery». Deepmind. Consultado el 30 de noviembre de 2020.

[26] Singh, Arunima (2020). «Deep learning 3D structures». Nature Methods (en inglés) 17 (3): 249. ISSN 1548-7105. PMID 32132733. doi:10.1038/s41592-020-0779-y.

[27] «CASP 13 data tables» (en inglés). CASP.

[28] Wei Zheng et al,Deep-learning contact-map guided protein structure prediction in CASP13, Proteins: Structure, Function, and Bioinformatics, 87(12) 1149–1164 doi 10.1002/prot.25792; and slides

[29] Hou, Jie; Wu, Tianqi; Cao, Renzhi; Cheng, Jianlin (25 de abril de 2019). «Protein tertiary structure modeling driven by deep learning and contact distance prediction in CASP13». Proteins: Structure, Function, and Bioinformatics (Wiley) 87 (12): 1165-1178. ISSN 0887-3585. doi:10.1002/prot.25697.

[:2-30] «DeepMind Breakthrough Helps to Solve How Diseases Invade Cells» (en inglés). 30 de noviembre de 2020. Consultado el 30 de noviembre de 2020.

[31] «deepmind/deepmind-research». GitHub (en inglés). Consultado el 30 de noviembre de 2020.

[32] «DeepMind's protein-folding AI has solved a 50-year-old grand challenge of biology». MIT Technology Review (en inglés). Consultado el 30 de noviembre de 2020.

[Casp14Experimentalists-34] Andriy Kryshtafovych (30 November 2020), Experimentalists: Are models useful?

[35] Lisa Kinch et al, CASP14 Tertiary Structure Prediction Assessment:Topology (FM) Category (CASP 14 presentation)

[CASP_release-36] Artificial intelligence solution to a 50-year-old science challenge could ‘revolutionise’ medical research (press release), CASP organising committee, 30 November 2020

[37] Le Page, Michael (30 de noviembre de 2020). «DeepMind's AI biologist can decipher secrets of the machinery of life». New Scientist (en inglés).

[38] «The predictions of DeepMind’s latest AI could revolutionise medicine». New Scientist (en inglés). 2 de diciembre de 2020.

[39] Metz, Cade (30 de noviembre de 2020). «London A.I. Lab Claims Breakthrough That Could Accelerate Drug Discovery». New York Times (en inglés).

[40] Sample, Ian (30 de noviembre de 2020). «DeepMind AI cracks 50-year-old problem of protein folding». The Guardian (en inglés).

[41] Roberts, Lizzie (30 de noviembre de 2020). «"Once in a generation advance" as Google AI researchers crack 50-year-old biological challenge». Daily Telegraph (en inglés).

[ElPais-42] Domínguez, Nuño (2 de diciembre de 2020). «La inteligencia artificial arrasa en uno de los problemas más importantes de la biología». El País.

[43] Kahn, Jeremy (30 de noviembre de 2020). «In a major scientific breakthrough, A.I. predicts the exact shape of proteins». Fortune (en inglés).

[Spiegel_1-44] Merlot, Julia (2 de diciembre de 2020). «Forscher hoffen auf Durchbruch für die Medikamentenforschung». Der Spiegel (en alemán).

[45] Al-Lazikani, Bissan (1 de diciembre de 2020). «The solving of a biological mystery]». The Spectator (en inglés).

[46] Whipple, Tom (30 de noviembre de 2020). «Deepmind finds biology’s ‘holy grail’ with answer to protein problem». The Times (en inglés).

[:0-47] AlQuraishi, Mohammed (8 de diciembre de 2020). «AlphaFold2 @ CASP14: "It feels like one's child has left home." The Method». Some Thoughts on a Mysterious Universe (en inglés). Consultado el 15 de diciembre de 2020.

[48] Edwards, Aled (5 de diciembre de 2020). «The AlphaFold2 success: It took a village» (en inglés). Structural Genomics Consortium.

[49] Briggs, David (4 de diciembre de 2020). «If Google’s Alphafold2 really has solved the protein folding problem, they need to show their working». The Skeptic (UK) (en inglés).

[50] «The Guardian view on DeepMind’s brain: the shape of things to come». The Guardian (en inglés). 6 de diciembre de 2020.

[Outeiral-51] Outeiral, Carlos (3 de diciembre de 2020). «CASP14: what Google DeepMind’s AlphaFold 2 really achieved, and what it means for protein folding, biology and bioinformatics» (en inglés). Oxford Protein Informatics Group.

[Ireland_rsb-52] Ireland, Tom (4 de diciembre de 2020). «How will AlphaFold change bioscience research?». The Biologist (en inglés). Royal Society of Biology.

[53] Bowman, Greg (8 de diciembre de 2020). Protein folding and related problems remain unsolved despite AlphaFold's advance (en inglés). Folding@home.

[Fadda-54] Bagdonas, Haroldas; Fogarty, Carl A.; Fadda, Elisa; Agirre, Jon (29 de octubre de 2021). «The case for post-predictional modifications in the AlphaFold Protein Structure Database». Nature Structural & Molecular Biology (en inglés): 1-2. ISSN 1545-9985. doi:10.1038/s41594-021-00680-9.

[55] Lowe, Derek (25 de septiembre de 2019). «In the Pipeline: What’s Crucial And What Isn’t». Science Translational Medicine (en inglés).

[56] Ball, Philip (9 de diciembre de 2020). «Behind the Screens of AlphaFold». Chemistry World (en inglés).

[57] Lowe, Derek (1 de diciembre de 2020). «In the Pipeline: The Big Problems». Science Translational Medicine (en inglés).

[58] «Alphafold Structure Predictions Available In Interpro». proteinswebteam.github.io (en inglés). InterPro. Consultado el 29 de julio de 2021.

[59] «Putting the power of AlphaFold into the world's hands». Deepmind (en inglés).

[alphafold-60] «AlphaFold Protein Structure Database». alphafold.ebi.ac.uk. Consultado el 29 de julio de 2021.

[61] Mihaly Varadi, Stephen Anyango, Mandar Deshpande, Sreenath Nair, Cindy Natassia, Galabina Yordanova, David Yuan, Oana Stroe, Gemma Wood, Agata Laydon, Augustin Žídek, Tim Green, Kathryn Tunyasuvunakool, Stig Petersen, John Jumper, Ellen Clancy, Richard Green, Ankur Vora, Mira Lutfi, Michael Figurnov, Andrew Cowie, Nicole Hobbs, Pushmeet Kohli, Gerard Kleywegt, Ewan Birney, Demis Hassabis, Sameer Velankar (January 2022). «AlphaFold Protein Structure Database: massively expanding the structural coverage of protein-sequence space with high-accuracy models». Nucleic Acids Research (en inglés) 50 (1): D439-D444. doi:10.1093/nar/gkab1061. Consultado el 4-8-2022.

[62] «AlphaFold Protein Structure Database». www.alphafold.ebi.ac.uk (en inglés). Consultado el 3 de agosto de 2022.

[63] «Putting the power of AlphaFold into the world’s hands». www.deepmind.com (en inglés). Consultado el 3 de agosto de 2022.

[64] Callaway, Ewen (28 de julio de 2022). «‘The entire protein universe’: AI predicts shape of nearly every known protein». Nature (en inglés) 608 (7921): 15-16. doi:10.1038/d41586-022-02083-2. Consultado el 3 de agosto de 2022.

[:1-65] «What use cases does AlphaFold not support?». www.alphafold.ebi.ac.uk (en inglés). Consultado el 3 de agosto de 2022.

[66] An, Hyun Joo; Froehlich, John W; Lebrilla, Carlito B (1 de octubre de 2009). «Determination of glycosylation sites and site-specific heterogeneity in glycoproteins». Current Opinion in Chemical Biology. Analytical Techniques/Mechanisms (en inglés) 13 (4): 421-426. ISSN 1367-5931. doi:10.1016/j.cbpa.2009.07.022.

[67] «AI Can Help Scientists Find a Covid-19 Vaccine» (en inglés). ISSN 1059-1028. Consultado el 1 de diciembre de 2020.

[:6-68] «Computational predictions of protein structures associated with COVID-19». Deepmind (en inglés). Consultado el 1 de diciembre de 2020.

[69] «How DeepMind's new protein-folding A.I. is already helping to combat the coronavirus pandemic.». Fortune (en inglés). Consultado el 1 de diciembre de 2020.

[1]

[2]

[n. 1]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[n. 2]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[n. 3]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]

[59]

[60]

[61]

[62]

[63]

[64]

[65]

[66]

AlphaFold

Información general
Tipo de programa	Modelo de inteligencia artificial Predicción de la estructura de las proteínas
Desarrollador	Google DeepMind
Modelo de desarrollo	Código abierto
Lanzamiento inicial	2018
Licencia	Apache 2.0 License
Información técnica
Programado en	Python
Versiones
Última versión estable	2.3.25 de abril de 2023
Enlaces
Sitio web oficial Repositorio de código
[editar datos en Wikidata]