En nuestra vida diaria, estamos expuestos a una gran cantidad de productos químicos en el medio ambiente y en los bienes, como alimentos, productos de tocador y envases de plástico. A pesar de constante esfuerzos institucionaleslos laboratorios de todo el mundo han podido evaluar una pequeña fracción de estos productos químicos en busca de efectos nocivos, y la razón es que evaluar cada uno de ellos, en promedio, lleva años y es muy costoso.
La predicción de toxicidad a través de métodos computacionales es crucial para ayudar a acelerar la identificación de sustancias nocivas, reduciendo significativamente los costos y reduciendo las pruebas con animales.
A lo largo de los años, los investigadores han explorado los métodos clásicos de aprendizaje automático para identificar moléculas, predecir la función de las proteínas y descubrir medicamentos utilizando gráficos. La idea principal de los métodos gráficos es representar datos en un dibujo simple usando puntos (vértices) y líneas que los conectan (aristas).
Puede sonar simple; sin embargo, los datos basados en gráficos pueden ser tremendamente difíciles de manipular. Una técnica que se ha implementado con éxito en el aprendizaje automático de gráficos utiliza un objeto matemático llamado núcleolo que simplifica enormemente las tareas.
Inspirándose en los métodos del kernel de grafos, los científicos de PASQAL han desarrollado un novedoso algoritmo de aprendizaje automático cuántico llamado Núcleo de evolución cuántica (QEK). Aplicaron con éxito este método, en nuestro procesador cuántico de átomos neutros, para predecir la toxicidad de los productos químicos incluidos en el conjunto de datos del Desafío de toxicidad predictiva en ratones hembra. El desafío consiste en crear modelos para identificar sustancias que causan cáncer en ratones a partir de la estructura molecular de los químicos.
Esta es la primera vez que se implementa un algoritmo de aprendizaje automático de gráficos cuánticos en hardware de átomos neutros, lo que muestra la ventaja potencial del algoritmo QEK. Publicamos los resultados hoy en el arXiv.
“Este es un gran logro porque el conjunto de datos es enorme, hay cientos de gráficos y, para cada gráfico, es necesario ejecutar muchas muestras. Esta es la primera vez que podemos codificar un gran conjunto de datos asociado a un caso real, no a un modelo de juguete”, dice Loïc Henriet, director técnico de PASQAL.
Pero antes de sumergirnos en los detalles del método kernel de evolución cuántica de PASQAL y cómo nuestros desarrolladores lo aplicaron para predecir la toxicidad en los productos químicos, es esencial comprender las ideas clave detrás de las técnicas clásicas de aprendizaje automático del kernel. Echemos un vistazo a ellos.
Tratar con un universo de datos a través de un núcleo
Imagina que eres bibliotecario y necesitas clasificar libros, pero todo lo que tienes son fragmentos de texto: palabras sueltas, frases, oraciones y párrafos de esos libros. Millones de fragmentos de texto. Con ellos, creas un índice para controlar la información. Sin embargo, la clasificación de libros mediante la búsqueda manual en un extenso índice de fragmentos de texto es un procedimiento muy ineficiente; por lo tanto, usas una computadora. Para que la computadora ayude, usted traduce el índice en objetos matemáticos (encuentre una incrustación para los datos). En muchos casos, los vectores (matrices de números ordenados) son muy útiles.
Sin embargo, en los métodos computacionales, existe un problema de equilibrio: cuantos más fragmentos de texto incluyas en el índice, más posibilidades tienes de tener éxito en la clasificación de los libros (expresividad). Sin embargo, los vectores pueden volverse tan grandes que sobrecargan la computadora (sobrecarga de computación y almacenamiento).
Aquí es donde el método kernel viene al rescate. El kernel es una cantidad que se puede definir usando vectores, por ejemplo, calculando su producto interno. El kernel se puede interpretar como una «distancia» (y debe tener las propiedades de una distancia) que le dice qué tan similares o diferentes son dos libros, sin tener que almacenar los vectores. Por lo tanto, el procedimiento se resume de la siguiente manera: tome dos libros y construya un vector para cada libro basado en su índice. Con estos dos vectores, calcula el núcleo. El valor del núcleo te dirá si son el mismo libro, similares o muy diferentes.
De la misma manera, podemos usar métodos kernel de aprendizaje automático para comparar y clasificar sustancias químicas a partir de su estructura molecular.
Métodos kernel en computación cuántica
La computación cuántica se basa en la física cuántica, que se define naturalmente en un entorno matemático ideal para incorporar datos y definir un kernel. Este escenario matemático es el espacio donde viven los estados cuánticos de los átomos y moléculas, que se representan como vectores. Este espacio es exponencialmente grande, adecuado para jugar al aumentar el número de qubits.
Para definir un núcleo cuántico, los desarrolladores de PASQAL utilizan una propiedad que se puede medir después de la evolución en el tiempo de un sistema cuántico. Sin embargo, en mecánica cuántica, no podemos calcular el resultado de una propiedad sino su probabilidad. Así, el kernel cuántico se define como una “distancia” entre las distribuciones de probabilidad de una propiedad de dos sistemas cuánticos, para la misma secuencia repetida muchas veces.
Estas son las ideas centrales detrás del método Quantum Evolution Kernel de PASQAL.
¿Cómo realizaron los científicos de PASQAL los experimentos en la arquitectura de nuestros átomos neutros, implementando con éxito QEK para predecir carcinógenos en ratones? Vamos a sumergirnos en los experimentos.
Moléculas recreadas en una unidad de procesamiento cuántico de átomos neutros
Con el procesador cuántico de átomos neutros de PASQAL, nuestros científicos representan las moléculas como gráficos y las recrean físicamente en matrices de átomos de rubidio. Organizan estas matrices disparando rayos láser enfocados, conocidos como pinzas ópticas, sobre los átomos, creando la forma que desean.
Una vez que los átomos, que representan los vértices del gráfico, están en posición, nuestros desarrolladores usan otro conjunto de rayos láser ajustados para acoplar dos estados atómicos, creando un qubit con cada átomo.
Un qubit es la unidad de información de computación cuántica representada por dos estados cuánticos (|0⟩ y |1⟩). Para este experimento, |0⟩ es el estado fundamental de los átomos y |1⟩ es su estado de Rydberg.
El estado de Rydberg es un nivel de energía muy alto en un átomo que hace que el átomo «crezca», lo que ayuda a promover interacciones con sus vecinos de manera controlada para recrear el gráfico deseado.
De esta forma, nuestros desarrolladores recrean una molécula en el hardware, donde cada qubit representa la posición de un átomo y las interacciones entre los qubits representan sus enlaces químicos.
Predicción de la toxicidad con Quantum Evolution Kernel
Una vez que el sistema está listo, como se describe en la sección anterior, el gráfico está en su estado cuántico inicial para que el kernel de evolución cuántica entre en acción. El procedimiento consiste en promover la evolución del gráfico en el tiempo disparando pulsos de láseres sintonizados durante un período corto.
Una vez que el sistema ha evolucionado a un nuevo estado cuántico, los científicos miden una propiedad global del gráfico, como el número total de sus estados excitados. Luego, repitieron este procedimiento varias veces, de modo que terminaron con una colección de momentos. — como cuadros en una película.
Con esta colección de momentos, nuestros desarrolladores construyen un histograma que se interpreta como la firma del gráfico. Luego, para la tarea de clasificación, comparan la firma de dos gráficos para evaluar sus similitudes.
Fuerza y limitaciones de la implementación experimental de QEK en toxicidad
Una característica clave de nuestro método es que no solo evalúa las propiedades locales del gráfico (sus vértices y sus interacciones) sino también las globales, como la presencia de ciclos. La capacidad de comparar formas globales es crucial para comprender las estructuras moleculares y predecir su función. Este enriquecimiento proporcionado por la tecnología PASQAL contrasta con muchos otros métodos clásicos de aprendizaje automático de gráficos, como las redes neuronales de paso de mensajes que solo pueden comparar los gráficos localmente (los vértices y su número de vecinos conectados a ellos), pero no el gráfico completo con su forma global.
Además, nuestro método Quantum Evolution Kernel, que implementa experimentalmente los datos del Desafío de toxicidad predictiva que comprende 286 moléculas de tamaños que van de 2 a 32 átomos, arrojó puntajes comparables con otros métodos clásicos de aprendizaje automático de gráficos conocidos, como Random Walk y Graphlet Sampling.
“Es genial ver en la práctica, en la vida real, algo que antes era solo una idea. Estamos resolviendo un problema real con un conjunto de datos bioquímicos reales. Y esto es algo que se podía ver, las imágenes de los átomos formando una molécula y viendo el resultado de los resultados haciendo lo que se suponía que debía hacer; realmente aplicar la computación cuántica a un problema real fue muy emocionante”, expresa Loïc Henriet.
Sin embargo, a pesar de su éxito, este resultado sigue siendo una prueba de concepto. Hasta ahora, “hemos estado trabajando con un solo conjunto de datos, y para poder probar algo, necesitaremos gráficos más grandes, o conjuntos de datos más grandes, o ser más diversos, abordar otros problemas. En el panorama del aprendizaje automático cuántico para conjuntos de datos gráficos, este es solo un punto, y necesitaremos realizar más experimentos para evaluar la viabilidad de este nuevo paradigma cuántico en comparación con los métodos clásicos de aprendizaje automático”, aclara Loïc Henriet.
Muchas aplicaciones impactantes surgen de métodos eficientes basados en gráficos. Ayudan a resolver problemas desafiantes, como describir redes sociales, predecir la función de proteínas, representar estructuras en lingüística, detectar fraudes y predecir toxicidad.
Por lo tanto, es esencial crear modelos de aprendizaje automático eficientes que aprendan y extraigan información de estructuras gráficas de manera correcta y efectiva.
Estamos seguros de que los métodos de computación cuántica PASQAL, implementados en nuestro hardware escalable de átomos neutros, ayudarán a acelerar la clasificación de toxicidad, reduciendo los costos y el sufrimiento de los animales en los experimentos.
¿Tiene alguna pregunta sobre nuestra tecnología y aplicaciones? ¡No dudes en contactarnos!
Referencias
- Helma, C., King, RD, Kramer, S. y Srinivasan, A. (2001). El desafío de la toxicología predictiva 2000–2001. Bioinformática, 17(1), 107–108. https://doi.org/10.1093/bioinformatics/17.1.107.
- Henriet, L., Beguin, L., Signoles, A., Lahaye, T., Browaeys, A., Reymond, GO y Jurczak, C. (2020). Computación cuántica con átomos neutros. Cuántico, 4327. https://doi.org/10.22331/q-2020-09-21-327.
- Henry, LP, Thabet, S., Dalyac, C. y Henriet, L. (2021). Núcleo de evolución cuántica: aprendizaje automático en gráficos con matrices programables de qubits. Examen físico A, 104(3). https://doi.org/10.1103/physreva.104.032416.
- Albrecht, B., Dalyac, C., Leclerc, L., Ortiz-Gutiérrez, L., Thabet, S., D’Arcangelo, M., Elfving, V., Lassablière, L., Silvério, H., Ximenez , B., Henry, L.-P., Signoles, A. y Henriet, L. (29 de noviembre de 2022). Mapas de funciones cuánticas para el aprendizaje automático de gráficos en un procesador cuántico de átomos neutros. Preimpresión disponible: https://doi.org/10.48550/arXiv.2211.16337.
Escritora: Alexandra de Castro. Colaboradores científicos: Loic Henriet y Vincent Elfving.