Pavlo Gonchar | Cohete ligero | Getty Images
El CEO de Twitter, Elon Musk, amenazó con demandar microsoft el miércoles, acusando al gigante del software de usar ilegalmente los datos de la compañía de redes sociales para entrenar su modelo de inteligencia artificial.
La amenaza de Musk por tuit se produjo después de Mashable y otras publicaciones reportado eso microsoft eliminaría a Twitter de su plataforma de publicidad, que permite a los compradores de anuncios administrar todas sus cuentas de redes sociales en un solo lugar.
«Entrenaron ilegalmente usando datos de Twitter», tuiteó Musk. «Tiempo de juicio».
Musk, quien también es CEO de tesla y SpaceX, a menudo tuitean sobre planes que nunca llegan a buen término, y parece que no se ha presentado ninguna demanda. La línea de prensa de Twitter no respondió de manera significativa a una solicitud de comentarios y un representante de Microsoft se negó a comentar.
La amenaza de Musk es el último indicio de que la propiedad de los datos se está convirtiendo rápidamente en un tenso campo de batalla en la fiebre de la IA generativa. Las grandes empresas tecnológicas están trabajando para desarrollar modelos de inteligencia artificial de vanguardia como GPT de OpenAI, y los propietarios de datos buscan detenerlos o cobrar por el uso de su contenido.
Microsoft desarrolla sus propios modelos de lenguaje extenso (LLM) y vende acceso a los modelos de OpenAI. Microsoft invirtió $ 10 mil millones en OpenAI el año pasado en un acuerdo inusualmente estructurado. Musk fue cofundador de OpenAI antes de dejar su directorio en 2018, y recientemente se quejó del cambio de la compañía de un modelo sin fines de lucro a un negocio muy valioso influenciado por Microsoft.
Los LLM como GPT requieren terabytes de datos para la capacitación, muchos de los cuales se extraen de sitios web como Reddit, StackOverflow y Twitter. Los datos de entrenamiento de las redes sociales son valiosos porque capturan conversaciones informales de ida y vuelta.
A medida que estos nuevos modelos de IA pasan de los laboratorios de investigación y las universidades al mundo corporativo, los propietarios de los datos comienzan a hacer demandas.
Por ejemplo, Reddit dijo a principios de esta semana que cobrar a las empresas por el acceso a su interfaz de programación utilizada para alimentar las conversaciones entre Redditors en el software de entrenamiento de IA. Grupo Universal Music también dijo esta semana que tal entrenamiento de la música de los artistas representaría «tanto un incumplimiento de nuestros acuerdos como una violación de la ley de derechos de autor» en respuesta a un video viral de una canción que afirmaba usar IA para imitar al rapero Drake.
Y base de datos de fotos de archivo Getty Images está demandando a Stable Diffusionalegando que la empresa copió su contenido para entrenar a su generador de imágenes de IA.
Musk dijo en diciembre que Twitter «pausaría» el acceso de OpenAI a su base de datos. También anunció planes para construir su propio modelo de lenguaje grande en una de sus empresas llamada TruthGPT.
MIRAR: Elon Musk quería hacerse cargo de OpenAI en 2018