LISBOA, Portugal — Los gigantes tecnológicos están invirtiendo cada vez más en el desarrollo de los llamados modelos de inteligencia artificial «soberanos» mientras buscan impulsar la competitividad centrándose más en la infraestructura local.
La soberanía de los datos se refiere a la idea de que los datos de las personas deben almacenarse en una infraestructura dentro del país o continente en el que residen.
«La IA soberana es un término relativamente nuevo que surgió en el último año», dijo a CNBC Chris Gow, líder de políticas públicas de la UE del gigante de redes de TI Cisco con sede en Bruselas.
Actualmente, muchos de los modelos de lenguajes más importantes (LLM), como ChatGPT de OpenAI y Claude de Anthropic, utilizan centros de datos con sede en EE. UU. para almacenar datos y procesar solicitudes a través de la nube.
Esto ha generado preocupación entre políticos y reguladores en Europa, quienes consideran que la dependencia de la tecnología estadounidense es perjudicial para la competitividad del continente y, lo que es más preocupante, para la resiliencia tecnológica.
¿De dónde viene la «soberanía de la IA»?
El Reglamento General de Protección de Datos de la Unión Europea, por ejemplo, exige que las empresas manejen los datos de los usuarios de una manera segura y conforme que respete su derecho a la privacidad. Casos de alto perfil en la UE también han generado dudas sobre si los datos sobre ciudadanos europeos pueden transferirse a través de fronteras de manera segura.
En 2020, el Tribunal de Justicia de la Unión Europea invalidó un marco de intercambio de datos entre la UE y EE. UU., alegando que el pacto no ofrecía el mismo nivel de protección que garantiza dentro de la UE el Reglamento General de Protección de Datos (GDPR). el año pasado el Marco de privacidad de datos UE-EE.UU. se formó para garantizar que los datos puedan fluir de forma segura entre la UE y los EE. UU.
En última instancia, estos acontecimientos políticos han resultado en un impulso hacia la localización de la infraestructura de la nube, donde se almacenan y procesan datos para muchos servicios en línea.
Filippo Sanesi, director global de marketing y operaciones de OVHCloud, dijo que la empresa francesa de nube está viendo una gran demanda de su infraestructura ubicada en Europa, ya que «entienden el valor de tener sus datos en Europa, que están sujetos a la legislación europea».
«A medida que este concepto de soberanía de datos se vuelve más maduro y la gente entiende lo que significa, vemos que cada vez más empresas comprenden la importancia de tener sus datos localmente y bajo una jurisdicción y gobernanza específicas», dijo Sanesi a CNBC. «Tenemos muchos datos», añadió. «Estos datos son soberanos en países específicos, bajo regulaciones específicas».
«Ahora, con estos datos, se pueden crear productos y servicios para la IA, y esos servicios deberían ser soberanos, deberían ser controlados, implementados y desarrollados localmente por talentos locales para la población o las empresas locales».
El impulso a la soberanía de la IA no ha sido impulsado por los reguladores, al menos no todavía, según Gow de Cisco. Más bien, proviene de empresas privadas, que están abriendo más centros de datos (instalaciones que contienen grandes cantidades de equipos informáticos para habilitar herramientas de inteligencia artificial basadas en la nube) en Europa, dijo.
La IA soberana está «más impulsada por la industria que la nombra así, que por el lado de los responsables políticos», dijo Gow. «Aún no se ve la terminología de ‘soberanía de la IA’ utilizada por parte del regulador».
Los países están impulsando la idea de la soberanía de la IA porque reconocen que la IA es «el futuro» y una «tecnología enormemente estratégica», dijo Gow.
Los gobiernos se están centrando en impulsar sus ecosistemas y empresas de tecnología nacionales, así como la importante infraestructura de backend que permite los servicios de IA.
«La carga de trabajo de IA utiliza 20 veces el ancho de banda de una carga de trabajo tradicional», afirmó Gow. Según Gow, también se trata de capacitar a la fuerza laboral, ya que las empresas necesitan trabajadores calificados para tener éxito.
Sin embargo, lo más importante de todo son los datos. «Lo que estamos viendo son bastantes intentos por parte de ese lado de pensar en capacitar a los LLM en datos localizados, en lenguaje», dijo Gow.
‘Reflejando valores’
En Italia, el primer LLM capacitado específicamente en los datos del idioma italianollamado Italia 9B, lanzado este verano.
El objetivo del proyecto Italia es almacenar resultados en una jurisdicción determinada y basarse en datos de ciudadanos dentro de esa región para que los resultados producidos por los sistemas de IA estén más basados en los idiomas, la cultura y la historia locales.
«La IA soberana trata de reflejar los valores de una organización o, igualmente, el país en el que se encuentra y los valores y el idioma», dijo David Hogan, jefe de ventas empresariales para EMEA del gigante fabricante de chips. NVIDIAdijo a CNBC.
«El principal desafío es que la mayoría de los modelos de frontera actuales se han entrenado principalmente con datos occidentales en general», añadió Hogan.
En Dinamarca, por ejemplo, donde Nvidia tiene una presencia importante, los funcionarios están preocupados por servicios vitales como la atención médica y las telecomunicaciones que se brindan mediante sistemas de inteligencia artificial que no «reflejan» la cultura y los valores daneses locales, según Hogan.
El miércoles, Dinamarca presentó un libro blanco histórico que describe cómo las empresas pueden utilizar la IA de conformidad con la próxima Ley de IA de la UE, la primera ley importante sobre IA del mundo. El documento está destinado a servir como modelo para que otros países de la UE lo sigan y adopten.
«Si estás en un país europeo que no es uno de los principales países con idiomas hablados internacionalmente, probablemente menos del 2% de los datos se basan en tu idioma, y mucho menos en tu cultura», dijo Hogan.
Cómo la regulación impulsó un cambio de mentalidad
Eso no quiere decir que las regulaciones no hayan demostrado ser un factor importante para lograr que los gigantes tecnológicos piensen más en construir una infraestructura de IA localizada en Europa.
Sanesi de OVHCloud dijo que regulaciones como el GDPR de la UE catalizaron gran parte del interés en deslocalizar el procesamiento de datos en una región determinada.
El concepto de soberanía de la IA también está consiguiendo la aceptación de las empresas tecnológicas europeas locales.
A principios de esta semana, el motor de búsqueda Ecosia, con sede en Berlín, y su homólogo Qwant, con sede en París, anunciaron una empresa conjunta para Desarrollar un índice de búsqueda europeo desde cero, con el objetivo de ofrecer mejores resultados en francés y alemán.
Mientras tanto, el operador de telecomunicaciones francés Naranja ha dicho que está en conversaciones con varias empresas fundamentales de modelos de IA sobre la construcción de un modelo de «IA soberana» basado en teléfonos inteligentes para sus clientes que refleje con mayor precisión su propio idioma y cultura.
«No tendría sentido crear nuestros propios LLM. Por eso, en este momento hay mucha discusión sobre cómo asociarnos con los proveedores existentes para hacerlo más local y seguro». dijo a CNBC Bruno Zerbib, director de tecnología de Orange.
«Hay muchos casos de uso en los que [AI data] se puede procesar localmente [on a phone] en lugar de procesarse en la nube», añadió Zerbib. Orange aún no ha seleccionado un socio para estas ambiciones de modelo soberano de IA.