A diferencia del cacheo explícito, el cacheo implícito funciona automáticamente. Activado por defecto para los modelos Gemini 2.5, traslada ahorros de costos si una solicitud a la API Gemini coincide con una caché previa.
¿Cómo funciona esta nueva tecnología?
"Cuando envías una solicitud a uno de los modelos Gemini 2.5, si la solicitud comparte un prefijo común con alguna de las solicitudes anteriores, entonces es elegible para un acierto de caché", explicó Google en un post de blog. "Trasladaremos dinámicamente los ahorros de costos a vos".
El recuento mínimo de tokens de prompt para el cacheo implícito es de 1.024 para 2.5 Flash y 2.048 para 2.5 Pro, según la documentación para desarrolladores de Google. Estos valores no representan cantidades excesivamente grandes, lo que significa que no debería requerir mucho esfuerzo para activar estos ahorros automáticos. Los tokens son fragmentos de datos con los que trabajan los modelos, equivaliendo mil tokens a aproximadamente 750 palabras.
Dado que las últimas afirmaciones de Google sobre ahorros de costos mediante cacheo generaron controversia, existen algunas áreas de precaución en esta nueva función. Por un lado, Google recomienda que los desarrolladores mantengan el contexto repetitivo al principio de las solicitudes para aumentar las probabilidades de aciertos de caché implícita. El contexto que podría cambiar entre solicitudes debería agregarse al final, según indica la compañía.
Por otro lado, Google no ofreció verificación independiente de que el nuevo sistema de cacheo implícito entregará los ahorros automáticos prometidos. Habrá que esperar a conocer la opinión de los primeros usuarios que adopten esta tecnología.
-----------------------------------------------------
Más contenido en Urgente24
Pepe Ochoa destruyó la imagen de Laurita Fernández: "Te haces la buena pero no lo sos"
Compararon a Lola con Diego Maradona y Yanina Latorre estalló: "Ella no escupe hijos"
Huawei presenta un smartwatch todoterreno: Qué funciones trae
Cajeros automáticos: Cómo aumentar tu límite de forma rápida y sencilla