OpenAI investiga si DeepSeek utilizó sus modelos para entrenar a su chatbot

En un comunicado se acusa directamente a empresas chinas de "tratar constantemente de destilar los modelos de las principales compañías de inteligencia artificial de Estados Unidos".

El fenómeno DeepSeek: objeto de sospechas en EEUU y disparador de la competencia en China

DeepSeek.
DeepSeek. / CAROLINE BREHMAN, EFE

La compañía estadounidense OpenAI investiga si la empresa emergente china DeepSeek entrenó a su nuevo chatbot utilizando repetidamente el modelo de inteligencia artificial (IA) previamente creado por la tecnológica con sede en Silicon Valley, según The Wall Street Journal citando a una fuente familiarizada con el asunto.

La empresa liderada por Sam Altman indica en un comunicado este miércoles que han registrado varios intentos procedentes de entidades chinas para tratar de extraer enormes volúmenes de datos de sus herramientas de IA.

Esto podría apuntar al nuevo chatbot DeepSeek R1, de código abierto, que ha causado todo un terremoto tecnológico en los últimos días con una reacción insólita de adversarios tecnológicos como Nvidia, que perdió el lunes 600.000 millones de dólares, la mayor caída diaria en la historia de Wall Street.

Trabajo con el Gobierno de EEUU para protegerlos de los rivales

"Es de vital importancia que trabajemos en estrecha colaboración con el gobierno de Estados Unidos para proteger mejor los modelos más capaces de los esfuerzos de los rivales y competidores por tomar la tecnología estadounidense", detalla OpenAI en el comunicado.

En el texto incluso se acusa directamente a empresas establecidas en China de "tratar constantemente de destilar los modelos de las principales compañías de inteligencia artificial de Estados Unidos".

Este proceso conocido como destilación se fundamenta en machine learning, permitiendo a modelos de IA menos sofisticados entrenarse a partir de grandes bases de datos de otros más eficientes y en los que se han invertido grandes sumas para desarrollarlos.

Las sospechas de OpenAI plantean la posibilidad de que el rendimiento del nuevo modelo R1 de DeepSeek, que está copando los focos por haber sido desarrollado con una inversión mucho menos cuantiosa que las diferentes versiones ChatGPT -entre otros modelos-, tendría una capacidad menos impresionante de lo que pareciera.

El sudafricano David Sacks, el zar para las criptomonedas y la IA del presidente estadounidense Donald Trump, aseguró que hay "pruebas consistentes" de que DeepSeek destiló el conocimiento de los modelos de OpenAI.

Sin embargo, la posición de DeepSeek días atrás al explicar su éxito se basó en que han conseguido sacar el mayor partido posible a chips menos avanzados gracias a una "programación inteligente" con el más alto rendimiento.

Uso de modelos patentados por OpenAI

El comunicado de OpenAI sigue a una información publicada por el diario Financial Times (FT), según la cual fuentes de OpenAI, afirmaron haber hallado pruebas de que DeepSeek utilizó los modelos patentados de la tecnológica estadounidense para entrenar a su propio competidor de código abierto.

El fabricante de ChatGPT dijo al FT que había visto alguna evidencia de "destilación" que sospecha que proviene de DeepSeek, suscitando sospechas sobre una posible violación de la propiedad intelectual.

La destilación es una práctica común en esta industria, pero si DeepSeek lo hubiera hecho para construir su propio modelo rival violaría los términos de servicio de OpenAI. "El problema es cuando [lo sacas de la plataforma y] lo estás haciendo para crear tu propio modelo para tus propios fines", dijo a ese diario una persona cercana a OpenAI.

stats