DeepMind y el Instituto Europeo de Bioinformática de EMBL (EMBL-EBI) han realizado predicciones impulsadas por IA de las estructuras tridimensionales de casi todas las proteínas catalogadas conocidas por la ciencia disponibles de forma gratuita y abierta para la comunidad científica, a través de la base de datos de estructuras de proteínas AlphaFold.
Las dos organizaciones esperan que la base de datos ampliada continúe aumentando nuestra comprensión de la biología, ayudando a muchos más científicos en su trabajo mientras buscan enfrentar los desafíos globales.
La base de datos se está ampliando aproximadamente 200 veces, de casi 1 millón de estructuras de proteínas a más de 200 millones, cubriendo casi todos los organismos de la Tierra cuyo genoma ha sido secuenciado. La expansión de la base de datos incluye estructuras predichas para una amplia gama de especies, incluidas plantas, bacterias, animales y otros organismos, lo que abre nuevas vías de investigación en las ciencias de la vida que tendrán un impacto en los desafíos globales, incluida la sostenibilidad y la inseguridad alimentaria. y enfermedades desatendidas.
Ahora, casi todas las secuencias de proteínas en el UniProt base de datos de proteínas vendrá con una estructura predicha. Este lanzamiento también abrirá nuevas vías de investigación, como el apoyo a la bioinformática y el trabajo computacional al permitir a los investigadores detectar potencialmente patrones y tendencias en la base de datos.
«AlphaFold ahora ofrece una vista en 3D del universo de las proteínas», dijo Edith Heard, directora general de EMBL. «La popularidad y el crecimiento de AlphaFold Database es testimonio del éxito de la colaboración entre DeepMind y EMBL. Nos muestra un vistazo del poder de la ciencia multidisciplinaria».
«Nos ha sorprendido la velocidad a la que AlphaFold ya se ha convertido en una herramienta esencial para cientos de miles de científicos en laboratorios y universidades de todo el mundo», dijo Demis Hassabis, fundador y director ejecutivo de DeepMind. «Desde la lucha contra las enfermedades hasta la contaminación por plásticos, AlphaFold ya ha permitido un impacto increíble en algunos de nuestros mayores desafíos globales. Nuestra esperanza es que esta base de datos ampliada ayude a muchos más científicos en su importante trabajo y abra vías completamente nuevas de descubrimiento científico».
Una herramienta esencial para los científicos.
DeepMind y EMBL-EBI lanzaron la base de datos AlphaFold en julio de 2021, con más de 350 000 predicciones de estructuras de proteínas, incluido el proteoma humano completo. Las actualizaciones posteriores vieron la adición de UniProtKB/SwissProt y 27 nuevos proteomas, 17 de los cuales representan enfermedades tropicales desatendidas que continúan devastando las vidas de más de mil millones de personas en todo el mundo.
En poco más de un año, más de 1000 artículos científicos han citado la base de datos y más de 500 000 investigadores de más de 190 países han accedido a la base de datos AlphaFold para ver más de dos millones de estructuras.
El equipo también ha visto a los investigadores aprovechar AlphaFold para crear y adaptar herramientas como foldseek y dalí que permiten a los usuarios buscar entradas similares a una determinada proteína. Otros han adoptado las ideas centrales de aprendizaje automático detrás de AlphaFold, formando la columna vertebral de una lista de nuevos algoritmos en este espacio, o aplicándolos a áreas como la predicción de la estructura del ARN o en el desarrollo de nuevos modelos para el diseño de proteínas.
Impacto y futuro de AlphaFold y la base de datos
AlphaFold también ha mostrado impacto en áreas como mejorar nuestra capacidad para combatir la contaminación plástica, obtener información sobre la enfermedad de Parkinson, aumentar la salud de las abejas melíferascomprenda cómo se forma el hielo, aborde enfermedades desatendidas como la enfermedad de Chagas y la leishmaniasis, y explore la evolución humana.
«Lanzamos AlphaFold con la esperanza de que otros equipos pudieran aprender y aprovechar los avances que hicimos, y ha sido emocionante ver que eso sucedió tan rápido. Muchas otras organizaciones de investigación de IA ahora han ingresado al campo y están aprovechando los avances de AlphaFold para crear más avances. Esta es realmente una nueva era en la biología estructural, y los métodos basados en IA impulsarán un progreso increíble «, dijo John Jumper, científico investigador y líder de AlphaFold en DeepMind.
«AlphaFold ha causado revuelo en la comunidad de biología molecular. Solo en el último año, ha habido más de mil artículos científicos sobre una amplia gama de temas de investigación que utilizan estructuras AlphaFold; nunca había visto algo así», dijo Sameer Velankar, Team Leader en el Banco de Datos de Proteínas de EMBL-EBI en Europa. «Y este es solo el impacto de un millón de predicciones; imagine el impacto de tener más de 200 millones de predicciones de estructuras de proteínas accesibles abiertamente en la base de datos AlphaFold».
DeepMind y EMBL-EBI continuarán actualizando la base de datos periódicamente, con el objetivo de mejorar las características y la funcionalidad en respuesta a los comentarios de los usuarios. El acceso a las estructuras seguirá estando completamente abierto, bajo una licencia CC-BY 4.0, y las descargas masivas estarán disponibles a través de Conjuntos de datos públicos de Google Cloud.
DeepMind y EMBL lanzan la base de datos más completa de estructuras 3D predichas de proteínas humanas
Base de datos: alphafold.ebi.ac.uk/
Citación: AlphaFold predice la estructura de casi todas las proteínas catalogadas conocidas por la ciencia (28 de julio de 2022) recuperado el 28 de julio de 2022 de https://phys.org/news/2022-07-alphafold-catalogued-protein-science.html
Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.