Google prepara Gemini Omni: el nuevo modelo de video que quiere competir con ByteDance

Capturas filtradas en Reddit revelaron funciones avanzadas de edición de video dentro de Gemini. El sistema permitiría modificar escenas, eliminar objetos y editar clips directamente desde un chat.

A pocos días del comienzo de Google I/O 2026, nuevas filtraciones dejaron al descubierto uno de los lanzamientos más esperados de Google en inteligencia artificial: Gemini Omni, un nuevo modelo de generación y edición de video impulsado por IA.

Las señales aparecieron durante el fin de semana cuando usuarios de Reddit comenzaron a publicar capturas de pantalla de una versión renovada de la interfaz de Gemini. Allí podía verse una nueva tarjeta de modelo con la descripción: “Create with Gemini Omni: meet our new video model, remix your videos, edit directly in chat, try templates, and more”.

Traducido al español, el mensaje decía: “Creá con Gemini Omni: conocé nuestro nuevo modelo de video, remixá tus videos, editá directamente en el chat, probá plantillas y más”.

La aparición del sistema parece haber sido accidental o parte de una prueba limitada tipo A/B test, aunque también funciona como una poderosa antesala del evento para desarrolladores que Google realizará el 19 y 20 de mayo.

Google apuesta a integrar todo dentro de Gemini

Las filtraciones refuerzan una estrategia que Google viene construyendo desde hace meses: convertir a Gemini en una plataforma multimodal unificada capaz de generar texto, imágenes, audio y video desde una misma interfaz.

Según las capturas compartidas, Gemini Omni permitiría editar escenas directamente mediante instrucciones escritas en lenguaje natural. Entre las funciones detectadas aparecen eliminación de marcas de agua, reemplazo de objetos dentro de clips y reescritura completa de escenas utilizando prompts conversacionales.

Los primeros resultados generados por el sistema despertaron opiniones mixtas. Algunos usuarios señalaron que la calidad cinematográfica todavía estaría por detrás de ByteDance y su modelo Seedance 2, actualmente considerado uno de los líderes del mercado de video generado por IA.

Sin embargo, el punto fuerte de Gemini Omni parece estar en las capacidades de edición más que en la generación pura. Para muchos analistas, eso no sería casualidad.

El antecedente de Nano Banana

El comportamiento del nuevo modelo recuerda a lo ocurrido con Nano Banana, el sistema de generación de imágenes integrado previamente en Gemini. En su lanzamiento inicial, el modelo recibió críticas moderadas por la calidad de sus imágenes, pero rápidamente comenzó a liderar rankings de edición visual gracias a sus capacidades para modificar contenido existente.

Con el tiempo, Google logró convertir ese modelo en un sistema de frontera dentro del mercado de IA visual.

Ahora, todo indica que la compañía intenta repetir la misma estrategia en video: priorizar la integración multimodal y la facilidad de edición antes que la supremacía absoluta en calidad visual durante la primera etapa del lanzamiento.

Las filtraciones también sugieren que Gemini Omni llegaría en distintas variantes, posiblemente denominadas Flash y Pro. Los videos vistos hasta ahora probablemente pertenecerían a la versión Flash, orientada a velocidad y menor costo computacional.

La batalla global por el video generado con IA

El lanzamiento se produce en un momento clave dentro de la industria tecnológica. Durante los últimos meses, empresas chinas como ByteDance, Kuaishou y MiniMax comenzaron a ganar terreno en el segmento de video generado por IA.

Modelos como Seedance 2, Kling y Hailuo vienen destacándose por su realismo, estabilidad visual y capacidad para interpretar instrucciones complejas.

Google, por su parte, busca apoyarse en su enorme ecosistema de datos y en plataformas como YouTube para fortalecer sus modelos multimodales.

Otro detalle relevante surgido en las capturas filtradas fue la aparición de una nueva pestaña de límites de uso dentro de Gemini. Algunos usuarios señalaron que la generación de video consumía créditos rápidamente, una señal de que Google podría implementar un sistema medido similar al utilizado en otros servicios de IA generativa.

El timing de la filtración parece perfectamente calculado. Google suele utilizar el I/O para presentar sus cambios más ambiciosos en inteligencia artificial y el adelanto de Gemini Omni le permite medir reacciones, instalar conversación y preparar el terreno antes de la keynote oficial.

La competencia por dominar el futuro del contenido generado por IA acaba de entrar en una nueva etapa. Y esta vez, el video parece ser el próximo gran campo de batalla.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

WP to LinkedIn Auto Publish Powered By : XYZScripts.com