El biólogo computacional Jue Wang ya se esforzaba por desarrollar una inteligencia artificial (IA) para producir medicamentos candidatos cuando tuvo que llevar a su hijo de 2 años al hospital con una infección respiratoria potencialmente letal. Después de ver a su hijo recuperarse rápidamente del virus respiratorio sincitial (RSV), Wang, asistente postdoctoral en la Universidad de Washington (UW), Seattle, y sus colegas redoblaron sus esfuerzos y ayer dieron a conocer en Ciencias un nuevo software de IA que puede «pintar» o «alucinar» estructuras para proteínas que aún no existen en la naturaleza. El software ya ha creado compuestos originales para su uso potencial en reacciones industriales, tratamiento del cáncer e incluso una vacuna candidata destinada a prevenir infecciones por RSV.
“Es el uso perfecto de la IA”, dice Yang Zhang, diseñador de proteínas de la Universidad de Michigan, Ann Arbor, que no participó en el trabajo. Aunque los investigadores han utilizado computadoras y otros medios para diseñar proteínas novedosas durante décadas, es probable que los enfoques de IA como este aumenten los éxitos, dice Zhang.
La IA desarrollada por Wang y sus colegas se basa en una serie de avances recientes en el uso de computadoras para predecir la estructura 3D de las proteínas naturales a partir de su secuencia básica de aminoácidos. El año pasado, un programa de inteligencia artificial llamado AlphaFold desarrollado por DeepMind, una empresa hermana de Google, produjo estructuras predichas para cientos de miles de proteínas humanas. AlphaFold y un paquete de software de IA similar llamado RoseTTAFold también ofrecieron miles de estructuras probables de varias proteínas, cada una unida a un compañero que se empareja con las células internas. El año pasado, tales hazañas ganaron software de predicción de estructura de proteínas. CienciasAvance del año 2021 de ‘s.
Una cosa es predecir cómo podrían plegarse las proteínas naturales; otra es diseñar nuevos desde cero. En 2017, por ejemplo, los investigadores dirigidos por el jefe de Wang, David Baker, un diseñador de proteínas en la UW, demostraron que podían usar un programa anterior de software de predicción de estructuras de proteínas sin inteligencia artificial que habían desarrollado, llamado simplemente Rosetta, para diseñar posibles medicamentos basados en proteínas. que se unen e inactivan objetivos moleculares en el virus de la influenza y una toxina bacteriana. Los miembros del equipo comenzaron alimentando el software con una parte ya conocida de lo que querían: una pequeña parte de la estructura de la proteína, llamada motivo de unión, que es capaz de unirse a su objetivo. Luego hicieron que Rosetta escaneara una base de datos de estructuras de proteínas que habían diseñado previamente y encontraran un andamio existente que posiblemente podría mantener el sitio activo en la forma correcta. Luego, el software unió las dos piezas y ajustó la combinación para hacer los refinamientos necesarios.
El problema es que el enfoque solo funcionó cuando Rosetta identificó un andamiaje adecuado. “Tenías que esperar que hubiera una buena combinación”, dice Baker. Ya no. Wang, Baker y sus colegas ahora han adaptado su RoseTTAfold impulsado por IA para idear sus propias proteínas desde cero utilizando dos estrategias diferentes. El primero, llamado inpainting, comienza como el esfuerzo anterior, dando a la IA un punto de partida, como un sitio activo u otra característica clave de una proteína deseada. Al igual que la función de autocompletar de un procesador de textos intenta completar una palabra después de haber escrito algunos caracteres, la IA se basa en su comprensión de cómo se pliegan las proteínas para completar partes adicionales de la proteína alrededor de la característica central.
El segundo enfoque, conocido como alucinación restringida, es más amplio. Le da al software un objetivo para una proteína, como la unión a un metal. Luego, el programa genera una proteína virtual compuesta por una secuencia aleatoria de aminoácidos y muta la secuencia una y otra vez, evaluando el impacto de cada cambio en la forma probable de la proteína y, por lo tanto, en su función. La IA mantiene las piezas que considera efectivas y muta el resto, evolucionando constantemente hacia la meta.
En ambos casos, las proteínas predichas finales pueden fabricarse en el laboratorio y analizarse. Y ambas estrategias funcionaron. Baker y sus colegas crearon proteínas novedosas capaces de unirse a los receptores de las células cancerosas, agarrar metales en solución y unir dióxido de carbono para su posible uso para extraerlo de la atmósfera. Finalmente, para identificar posibles vacunas contra el RSV, la IA del equipo alucinó 37 proteínas con el objetivo de presentar una parte clave del virus, llamada sitio V de la proteína F, al sistema inmunitario. Se descubrió que tres de los 37 se unían a un anticuerpo neutralizante del RSV conocido, lo que indica su probable eficacia.
Los resultados no siempre son perfectos. En varios casos, la actividad de las nuevas proteínas, como las diseñadas para unir metales, inicialmente no coincidía con las versiones naturales, señala Joe Watson, un postdoctorado en el laboratorio de Baker. Pero al imaginar diferentes proteínas, el software crea estructuras que no se han visto hasta ahora en la naturaleza. Luego, los investigadores pueden usarlos como puntos de partida para otras técnicas comprobadas para desarrollar proteínas mejoradas en el laboratorio, dice Watson. “Esto nos da muchos nuevos puntos de partida”.