Nicole Brichtova, líder de producto en modelos de generación visual de Google DeepMind, explicó que este sistema representa un salto cualitativo enormous. "Estamos impulsando la calidad visual hacia adelante, junto con la capacidad del modelo para seguir instrucciones", declaró en una entrevista exclusiva.
El contexto es claro: OpenAI dominó el mercado cuando lanzó el generador nativo de imágenes de GPT-4o en marzo, provocando que el uso de ChatGPT se disparara exponencialmente. Mientras tanto, Meta anunció la semana pasada que licenciaría modelos de IA de imagen de la startup Midjourney.
Precisión milimétrica y control creativo total
El nuevo modelo de Google se diseñó específicamente pensando en casos de uso doméstico, como ayudar a visualizar proyectos de hogar y jardín. Además, posee un "conocimiento del mundo" superior, permitiendo combinar múltiples referencias en una sola instrucción.
Sin embargo, Google no olvida las lecciones del pasado. La compañía implementó salvaguardas estrictas después de controversias previas con generadores de imágenes históricamente inexactas. Ahora, las imágenes generadas incluyen marcas de agua visuales e identificadores en metadatos para combatir los deepfakes.
La batalla está servida: ChatGPT registra más de 700 millones de usuarios semanales, mientras Gemini alcanza 450 millones mensuales. ¿Será "Nano Banana" el as bajo la manga que Google necesitaba?
---------------------------------------------------------------------------------------
Más contenido de Urgente24
Se viene el "uno-dos" del Congreso a Javier Milei: El Senado trata universidades, Garrahan y decretos delegados
Mal día para 'el Javo': Karina Milei expuesta por 2da. vez (y por lo mi$mo)
Tasas descontroladas hace un mes, pero Javier Milei responsabiliza al Congreso
Muy raro lo de Spagnuolo: "Designación" limitada y silencio sobre Karina Milei y los Menem