Investigadores de la Universidad de Amsterdam, junto con colegas de la Universidad de Queensland y el Instituto Noruego para la Investigación del Agua, han desarrollado una estrategia para evaluar la toxicidad de los productos químicos mediante el aprendizaje automático. Presentan su enfoque en un artículo de Environmental Science & Technology para el número especial «Data Science for Advancing Environmental Science, Engineering, and Technology». Los modelos desarrollados en este estudio pueden conducir a mejoras sustanciales en comparación con las evaluaciones ‘in silico’ convencionales basadas en el modelado de la Relación Estructura-Actividad Cuantitativa (QSAR).
Según los investigadores, el uso del aprendizaje automático puede mejorar enormemente la evaluación de peligros de las moléculas, tanto en el desarrollo seguro por diseño de nuevos productos químicos como en la evaluación de productos químicos existentes. La importancia de esto último queda ilustrada por el hecho de que las agencias químicas europeas y estadounidenses han enumerado aproximadamente 800 000 productos químicos que se han desarrollado a lo largo de los años, pero de los que se sabe poco o nada sobre su destino o toxicidad en el medio ambiente.
Dado que una evaluación experimental del destino químico y la toxicidad requiere mucho tiempo, esfuerzo y recursos, los enfoques de modelado ya se utilizan para predecir indicadores de peligro. En particular, a menudo se aplica el modelo de relación estructura-actividad cuantitativa (QSAR), que relaciona las características moleculares, como la disposición atómica y la estructura 3D, con las propiedades fisicoquímicas y la actividad biológica. Según los resultados del modelo (o los datos medidos cuando estén disponibles), los expertos clasifican una molécula en categorías como se define, por ejemplo, en el Sistema Globalmente Armonizado de Clasificación y Etiquetado de Productos Químicos (GHS). Para categorías específicas, las moléculas se someten a más investigación, a un control más activo y, finalmente, a la legislación.
Sin embargo, este proceso tiene inconvenientes inherentes, muchos de los cuales se remontan a las limitaciones de los modelos QSAR. A menudo se basan en conjuntos de entrenamiento muy homogéneos y asumen una relación estructura-actividad lineal para hacer extrapolaciones. Como resultado, muchos productos químicos no están bien representados por los modelos QSAR existentes y sus usos pueden conducir potencialmente a errores de predicción sustanciales y clasificación errónea de productos químicos.
Saltarse la predicción QSAR
En el artículo publicado en Environmental Science & Technology, el Dr. Saer Samanipour y los coautores proponen una estrategia de evaluación alternativa que omite por completo el paso de predicción QSAR. Samanipour, científico analítico ambiental del Instituto Van ‘t Hoff de Ciencias Moleculares de la Universidad de Ámsterdam, se asoció con la Dra. Antonia Praetorius, química ambiental del Instituto de Biodiversidad y Dinámica de Ecosistemas de la misma universidad. Junto con colegas de la Universidad de Queensland y el Instituto Noruego para la Investigación del Agua, desarrollaron una estrategia basada en el aprendizaje automático para la clasificación directa de la toxicidad acuática aguda de los productos químicos en función de los descriptores moleculares.
El modelo fue desarrollado y probado a través de 907 datos obtenidos experimentalmente para la toxicidad aguda de los peces (valores 96h LC50). El nuevo modelo omite la predicción explícita de un valor de toxicidad (96h LC50) para cada sustancia química, pero clasifica directamente cada sustancia química en una serie de categorías de toxicidad predefinidas. Estas categorías pueden, por ejemplo, estar definidas por regulaciones específicas o sistemas de estandarización, como se demuestra en el artículo con las categorías del SGA para peligros acuáticos agudos. El modelo explicó alrededor del 90 % de la varianza en los datos utilizados en el conjunto de entrenamiento y alrededor del 80 % para los datos del conjunto de prueba.
Predicciones de mayor precisión
Esta estrategia de clasificación directa resultó en una disminución de cinco veces en la categorización incorrecta en comparación con una estrategia basada en un modelo de regresión QSAR. Posteriormente, los investigadores ampliaron su estrategia para predecir las categorías de toxicidad de un gran conjunto de 32.000 sustancias químicas.
Demuestran que su enfoque de clasificación directa da como resultado predicciones de mayor precisión porque los conjuntos de datos experimentales de diferentes fuentes y para diferentes familias químicas se pueden agrupar para generar conjuntos de entrenamiento más grandes. Puede adaptarse a diferentes categorías predefinidas según lo prescrito por varios reglamentos internacionales y sistemas de clasificación o etiquetado. En el futuro, el enfoque de clasificación directa también se puede expandir a otras categorías de peligro (p. ej., toxicidad crónica), así como al destino ambiental (p. ej., movilidad o persistencia), y muestra un gran potencial para mejorar las herramientas in-silico para la evaluación de riesgos y peligros químicos.
Fuente de la historia:
Materiales proporcionado por Universidad de Amsterdam. Nota: el contenido se puede editar por estilo y longitud.