Una filial de Google consigue un avance sin precedentes en la predicción de la forma de las proteínas
Un sistema de inteligencia artificial desarrollado por Google ha resuelto buena parte de uno de los problemas más importantes de la biología. Las redes neuronales desarrolladas por la empresa Deepmind, propiedad del gigante tecnológico, han demostrado en una competición internacional que su capacidad de cálculo y predicción son muy superiores a la de cualquier humano e incluso a la de cualquier otro sistema de inteligencia artificial creado por humanos.
“Es una revolución”, reconoce Alfonso Valencia, uno de los mayores expertos en biocomputación de España y miembro del jurado técnico del concurso CASP, siglas inglesas de técnicas para la predicción de estructuras de las proteínas. “Lo más importante que nos deja este avance es saber que este problema [que nadie había resuelto desde que se formuló hace 50 años] tiene solución, que es posible resolverlo”.
El problema del plegado de las proteínas está considerado como el segundo código secreto de la vida. Deepmind había ya ganado a los humanos en ajedrez y el complicadísimo Go, por ejemplo, pero este siempre ha sido su problema prioritario a resolver.
Para comprender su importancia hay que empezar por el primer código de la vida, el genoma, que contiene toda la información para formar cualquier ser vivo. Una persona es una secuencia genómica de 3.000 millones de letras, cada una en su posición correcta. En esas letras están todas las instrucciones para fabricar proteínas, que son las verdaderas obreras de la vida encargadas de que alguien pueda respirar, moverse, pensar, vivir. La estructura básica del código genético es bidimensional, pero las proteínas que forma son tridimensionales, como la diferencia entre el plano de una casa y la casa de verdad.
Uno de los mayores hitos científicos de esta pandemia ha sido conocer la estructura de la proteína del nuevo coronavirus que encaja exactamente en otra proteína de las células humanas para adueñarse de ellas. Las proteínas mal construidas, mal plegadas sobre sí mismas, son la causa de enfermedades tan terribles como el alzhéimer, el parkinson y muchas otras.
En 1972, el Nobel de Química Christian Anfinsen postuló que la secuencia de aminoácidos de una proteína [su plano] debía predecir la forma que tendría. Pero averiguar todas las configuraciones posibles de una sola proteína puede llevar más de 13.700 millones de años: la edad del universo.
En el concurso CASP Deepmind competía con otros 100 equipos en ser el mejor en predecir la forma de 100 proteínas basándose en su secuencia de aminoácidos. La inteligencia artificial de Google ha arrasado. Su sistema, Alphafold, ha predicho correctamente la estructura de dos tercios de todas las proteínas con una resolución equivalente a la de los métodos convencionales basados en cristalografía y microscopía, que requieren máquinas de unos ocho millones de euros y en ocasiones años o décadas de trabajo.
Es un resultado nunca alcanzado antes por ningún equipo humano ni por ninguna otra inteligencia artificial. El margen de error de las predicciones de Google es equivalente al diámetro de un solo átomo, explica Deepmind, que ya ganó la anterior edición en 2018.
“Su puntuación es muy, muy superior a la de cualquier otro equipo del certamen”, explica Tim Hubbard, bioquímico del King’s College de Londres y organizador de este concurso académico durante 10 años. “Esta contribución es fundamental porque nos ayuda a resolver un problema que determina no solo la biología humana, sino la del resto de seres vivos del planeta”, resalta Hubbard.
Alphafold se basa en algoritmos que aprenden por sí mismos y ven patrones no visibles para humanos, pues están escondidos en inabarcables bases de datos con miles de proteínas compuestas por millones de fragmentos. “Este tipo de sistemas ya había ganado a los humanos en videojuegos porque encontraba errores en la programación que permitían por ejemplo atravesar paredes”, explica Valencia. “Gana a los humanos con formas de pensar no humanas, por eso aunque este sistema pudiese hablar y nos contara cómo lo ha hecho, no entenderíamos la física que hay detrás de una proteína plegándose. Solo conocemos el resultado. Google no proporciona el software y esta es la parte frustrante del logro porque no va a beneficiar directamente a la ciencia”, detalla.
“No creemos que Deepmind vaya a poner Alphafold al servicio de la comunidad científica, pues no lo hizo después de la primera vez que ganó el certamen”. No obstante habrá una repercusión “indirecta”, añade. Deepmind describirá todos sus métodos en un estudio completo revisado por expertos independientes y esto podrá ayudar a otros equipos a desarrollar sistemas de inteligencia artificial similares.
“Es un paso muy importante, se llevaba muchos años intentando descifrar ese código oculto de la vida”, resume Fernando Corrales, investigador del Centro Nacional de Biotecnología del CSIC. En la naturaleza puede haber decenas de miles de proteínas diferentes y cada una es un mundo completamente diferente del otro. “Hay ocasiones en las que se puede conocer la estructura completa en apenas un mes, y otras en las que es complejísimo y puede llevar años o décadas”, señala Corrales. Para este científico la inteligencia artificial de Google no dejará sin trabajo a los cristalógrafos y expertos en microscopía en el corto plazo, pues aún son necesarias para corroborar las predicciones de la inteligencia artificial. Además, el problema del plegamiento de proteínas no se ha resuelto del todo, pues quedan niveles adicionales de complejidad. Las proteínas suelen funcionar en grupos formando complejos y entender su forma y movimiento es un problema que por ahora sigue sin resolver.
Deepmind explica a este diario que publicará todos los detalles sobre su sistema en una revista científica próximamente. Sus responsables explicarán su trabajo esta tarde en una conferencia online. Un portavoz de la empresa ha señalado que aún no han decidido si harán su sistema accesible a la comunidad científica. “Aunque de alguna manera hemos resuelto el problema de plegado de las proteínas, hay muchos otros que nos gustaría afrontar. Somos optimistas en que este sistema puede ayudarnos a comprender enfermedades y a descubrir nuevos fármacos”, señala.