OMNI DeepSeek > ChatGPT > Google

¿ESTO ES LEGAL?

DeepSeek (el ChatGPT de china) 'robó' datos de Google para crear su súper IA

Acusan a DeepSeek de usar información del modelo Gemini para entrenar su nueva inteligencia artificial. La polémica sacude el mercado por usar Google.

La guerra de la inteligencia artificial acaba de subir de tono. DeepSeek, el laboratorio chino que sorprendió al mundo con su modelo R1, quedó en el ojo de la tormenta después de que varios desarrolladores acusaran a la compañía de usar datos del Gemini de Google para entrenar su nueva tecnología. ¿Qué pasó con el ChatGPT chino?

SpeechMap, creador de una herramienta de evaluación para IA bajo seudónimo, notó que los "rastros de pensamiento" del modelo chino —las reflexiones que genera mientras procesa información— "se leen como rastros de Gemini". Esta similitud despertó sospechas inmediatas en la comunidad tech.

image.png
La polémica actual no surge de la nada.

La polémica actual no surge de la nada.

En diciembre pasado, DeepSeek ya protagonizó otro escándalo cuando su modelo V3 se identificaba frecuentemente como ChatGPT, sugiriendo que podría estar entrenado con conversaciones de la plataforma de OpenAI. Esta situación reforzó las dudas sobre las prácticas del laboratorio asiático.

Además, OpenAI reveló al Financial Times que encontró evidencia vinculando a DeepSeek con la destilación de datos, una técnica que permite extraer información de modelos más grandes y capaces. Microsoft detectó que grandes cantidades de datos estaban siendo extraídas a través de cuentas de desarrolladores de OpenAI a finales de 2024, cuentas que la empresa cree están afiliadas con DeepSeek.

Las medidas de protección se intensifican

Frente a estos riesgos, las empresas tecnológicas están reforzando sus defensas. OpenAI implementó en abril un proceso de verificación de identidad para acceder a ciertos modelos avanzados, excluyendo específicamente a China de la lista de países autorizados. Por su parte, Google comenzó a "resumir" los rastros generados por sus modelos disponibles en AI Studio, dificultando el entrenamiento de IA rivales.

image.png

La polémica surge porque DeepSeek habría violado las reglas del juego establecidas por OpenAI y Google. Los términos de servicio de OpenAI prohíben expresamente usar las respuestas de sus modelos para construir IA competidora, mientras que Google considera esta práctica como una amenaza a sus ventajas competitivas. Si las acusaciones son ciertas, DeepSeek no solo infringió contratos, sino que aprovechó años de investigación ajena sin reconocimiento ni compensación.

Sin embargo, algunos expertos argumentan que la destilación de datos es una práctica común en el desarrollo de inteligencia artificial. Nathan Lambert, investigador del instituto AI2, sugiere que para DeepSeek tiene sentido económico crear datos sintéticos a partir de los mejores modelos disponibles, especialmente considerando que la empresa china tiene limitaciones de hardware pero abundante capital. Esta estrategia les permite acceder efectivamente a más poder computacional del que poseen físicamente.

image.png

La controversia también refleja tensiones geopolíticas más amplias entre China y Estados Unidos en el sector tecnológico. El hecho de que DeepSeek sea una empresa china desarrollando IA competitiva usando supuestamente datos estadounidenses añade una dimensión estratégica al conflicto.

Las restricciones que OpenAI impuso específicamente excluyendo a China de ciertos servicios evidencian estas preocupaciones sobre transferencia tecnológica y competencia desleal en un sector considerado crítico para la seguridad nacional.

---------------------------------------------------------------

Más contenido en Urgente24

Tras la polémica un con chico autista, exigen la renuncia de Diego Spagnuolo

Expensas al límite: Buscan reformar las negociaciones salariales del personal de edificios

Con afiche y spot, Cristina se lanza a nacionalizar el 7-S