DeepMind integra un nuevo modelo de edición de imágenes en Gemini: “mantenerte, pero mejor”

Google integró en la app Gemini un modelo de edición desarrollado por DeepMind que promete conservar el parecido de personas y mascotas a lo largo de múltiples ediciones, activar ediciones en varias etapas y añadir funciones de mezcla y transferencia de estilo; todas las imágenes editadas llevarán una marca de agua visible y la marca digital SynthID.

Google anunció una actualización importante de la edición nativa de imágenes en la app Gemini, impulsada por un nuevo modelo de DeepMind que, en vistas previas, ya recibió elogios por su capacidad para mantener la identidad visual de los sujetos aun tras transformaciones drásticas.

¿Qué Cambia?

Según la compañía, ahora basta con subir una foto y describir el cambio deseado para, por ejemplo, probar peinados de otra época, cambiar vestuario o colocar a una persona junto a su mascota en una escena completamente nueva.

El post oficial de Google subraya el problema que el modelo pretende resolver: “sabemos que cuando editás fotos tuyas o de personas que conocés bien, los fallos sutiles importan —una representación que está ‘cerca pero no es exactamente igual’ no se siente bien”, y por eso el equipo trabajó en mantener la consistencia del “parecido” a lo largo de las ediciones.

Entre las capacidades prácticas que Google destaca están la edición “multi-turn” (varias rondas de ajustes sin perder coherencia), la mezcla de fotografías para crear escenas nuevas y la transferencia de texturas o patrones entre objetos —por ejemplo, aplicar el estilo de una flor a una prenda—, todo desde la misma interfaz móvil.

Transparencia y seguridad: visible + SynthID

Google asegura que todas las imágenes creadas o editadas en Gemini incluirán “una marca de agua visible, así como nuestra marca de agua digital invisible SynthID, para mostrar claramente que son generadas por IA”. Esa doble señalización forma parte del paquete de privacidad y seguridad que la compañía comercializa como esencial para mitigar el mal uso de imágenes generadas por IA.

SynthID, desarrollado por DeepMind/Google, es la tecnología detrás de la marca digital invisible: su objetivo es permitir la identificación de contenido generado o alterado por IA, aunque expertos y periodistas han advertido que los marcos técnicos y regulatorios aún deben consolidarse para evitar usos maliciosos (deepfakes, suplantación de identidad, manipulación informativa).

Disponibilidad y recepción

El nuevo modelo (comunicaciones y notas de prensa lo han promocionado bajo nombres informales en medios como “Nano Banana” o como parte de Gemini 2.5 Flash Image) ya está integrado en la app Gemini y se ofrece a usuarios tanto gratuitos como de pago, según las comunicaciones oficiales y coberturas tecnológicas. En reseñas tempranas la herramienta fue calificada como una de las mejores para edición guiada por IA por su fidelidad en el parecido y su flujo de trabajo iterativo.

Implicancias creativas y riesgos que conviene considerar

Para creadores y equipos de producto, la actualización ofrece una vía para acelerar prototipos visuales, producir contenidos más ricos sin rodajes costosos y explorar nuevas formas de narrativa visual. Sin embargo, abre preguntas inevitables: ¿cómo se regula la autoría y el consentimiento cuando la IA recrea la imagen de una persona? ¿qué controles son necesarios para que la marca visible e invisible no puedan ser eludidas o falsificadas? Analistas indican que la doble marca (visible + SynthID) es un buen primer paso, pero que la respuesta tecnológica debe complementarse con políticas de uso, detección y responsabilidad.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

WP to LinkedIn Auto Publish Powered By : XYZScripts.com