Google: Gemini lanza una función clave que promete ahorrar hasta un 75% en costos

Mirá que se trae entre manos Google.

Google acaba de implementar una nueva funcionalidad en su API Gemini que revoluciona el panorama económico para desarrolladores que trabajan con inteligencia artificial. La gigante tecnológica asegura que esta innovación permitirá abaratar significativamente los costos de operación para quienes utilizan sus modelos más avanzados.

image.png

La técnica de cacheo, ampliamente utilizada en la industria de la inteligencia artificial, reutiliza datos frecuentemente accedidos o pre-calculados para reducir requisitos computacionales y costos. Por ejemplo, las cachés pueden almacenar respuestas a preguntas que los usuarios hacen frecuentemente, eliminando la necesidad de que el modelo recree respuestas a solicitudes idénticas.

La característica, denominada "cacheo implícito", llegó en un momento crítico cuando el uso de modelos de frontera continúa incrementando sus tarifas. Según Google, esta innovación podría generar un ahorro del 75% en lo que denominan "contexto repetitivo" transmitido a los modelos mediante la API Gemini. Por ahora, la función es compatible exclusivamente con los modelos Gemini 2.5 Pro y 2.5 Flash.

Quizás te interese leer: Las nuevas 3 herramientas de Google para aprender idiomas: Clases personalizadas y 100% gratis

Un cambio radical en la implementación para Google

Anteriormente, Google ofrecía cacheo de prompts de modelo, pero únicamente de forma “explícita”, lo que obligaba a los desarrolladores a definir manualmente sus prompts de mayor frecuencia. Si bien se suponía que el ahorro estaba garantizado, el cacheo explícito típicamente involucraba mucho trabajo manual.

Algunos desarrolladores expresaron su descontento con la implementación del cacheo explícito para Gemini 2.5 Pro, alegando que podía ocasionar facturas sorpresivamente altas. Las quejas alcanzaron un punto crítico la semana pasada, lo que llevó al equipo de Gemini a disculparse y comprometerse a realizar cambios.

image.png

A diferencia del cacheo explícito, el cacheo implícito funciona automáticamente. Activado por defecto para los modelos Gemini 2.5, traslada ahorros de costos si una solicitud a la API Gemini coincide con una caché previa.

¿Cómo funciona esta nueva tecnología?

"Cuando envías una solicitud a uno de los modelos Gemini 2.5, si la solicitud comparte un prefijo común con alguna de las solicitudes anteriores, entonces es elegible para un acierto de caché", explicó Google en un post de blog. "Trasladaremos dinámicamente los ahorros de costos a vos".

El recuento mínimo de tokens de prompt para el cacheo implícito es de 1.024 para 2.5 Flash y 2.048 para 2.5 Pro, según la documentación para desarrolladores de Google. Estos valores no representan cantidades excesivamente grandes, lo que significa que no debería requerir mucho esfuerzo para activar estos ahorros automáticos. Los tokens son fragmentos de datos con los que trabajan los modelos, equivaliendo mil tokens a aproximadamente 750 palabras.

image.png

Dado que las últimas afirmaciones de Google sobre ahorros de costos mediante cacheo generaron controversia, existen algunas áreas de precaución en esta nueva función. Por un lado, Google recomienda que los desarrolladores mantengan el contexto repetitivo al principio de las solicitudes para aumentar las probabilidades de aciertos de caché implícita. El contexto que podría cambiar entre solicitudes debería agregarse al final, según indica la compañía.

Por otro lado, Google no ofreció verificación independiente de que el nuevo sistema de cacheo implícito entregará los ahorros automáticos prometidos. Habrá que esperar a conocer la opinión de los primeros usuarios que adopten esta tecnología.

-----------------------------------------------------

Más contenido en Urgente24

Pepe Ochoa destruyó la imagen de Laurita Fernández: "Te haces la buena pero no lo sos"

Compararon a Lola con Diego Maradona y Yanina Latorre estalló: "Ella no escupe hijos"

Huawei presenta un smartwatch todoterreno: Qué funciones trae

Cajeros automáticos: Cómo aumentar tu límite de forma rápida y sencilla

ATENTOS

Google: Gemini lanza una función clave que promete ahorrar hasta un 75% en costos

Un cambio radical en la implementación para Google

¿Cómo funciona esta nueva tecnología?

Más contenido en Urgente24

Un gigante alemán para su planta cordobesa, única en Sudamérica, y hay 340 trabajadores afectados

Acorralado, Manuel Adorni deja de ser vocero presidencial

Antonela Roccuzzo no perdona el desastre de Luzu TV y tomó una decisión filosa

La fuerte respuesta de la madre de Lionel Messi a Florencia Peña: "No lo hizo"

El Trece baja sus programas más rendidores y admite una derrota anunciada

Te puede interesar

Gemini rompe una barrera y ahora promete recordar absolutamente todo

Misteriosa gema aparece en meteorito de Marte y hay shock en la ciencia

Vacuna contra el VPH logra algo insólito: El hallazgo que paraliza al mundo

IA: El robot conejo que te saluda por tu voz y mejora la vida de los mayores

Temas

No te lo pierdas

Inversor de Dubai en Cuba solicita rebautizar Cayo Santa María como Trump Island

Aldeas para vivir la Tercera Edad entre amigos y en contacto con la Naturaleza

El error de Javier Milei y la devolución de favores a Adrián Ravier

Manuel Adorni se queda sin vocería y Patricia Bullrich gana un diputado: Quién reemplaza a Adrián Ravier

Israel y Hezbollah acordaron otro alto el fuego en el Líbano y van...

Prepagas al borde del temblor: Revelan un dato que enciende todas las alarmas

A los 46, Ronaldinho fichó para el Ravenna FC, de los Cipriani

Se peleó con la dirigencia, Coudet lo tachó y se va de River: "Vendido"

Ojo con el estrés futbolero: Qué le pasa al cuerpo cuando seguimos un partido decisivo

Gemini rompe una barrera y ahora promete recordar absolutamente todo

Inversor de Dubai en Cuba solicita rebautizar Cayo Santa María como Trump Island

CONSPIRACIONES

El New York Times dice que Epstein se suicidó, pero The Independent lo liga a Trump

El video de Gaspi que parece anticipar su propia muerte

Estados Unidos financió en el mundo 120 biolaboratorios de virus y patógenos

Histeria colectiva en Albania contra Ivanka Trump y Jared Kushner por apropiarse de un humedal

China denuncia que hay reclutamiento occidental para espionaje

El capitán Sturze y la batalla naval (contra la Marina Mercante)

Suscripciones

Contactanos

Qué es Urgente24

RSS

Nuestro periodismo

ATENTOS

Google: Gemini lanza una función clave que promete ahorrar hasta un 75% en costos

Seguir leyendo

Un cambio radical en la implementación para Google

¿Cómo funciona esta nueva tecnología?

Más contenido en Urgente24

Te puede interesar

Temas

No te lo pierdas

CONSPIRACIONES