OpenAI lanza la nueva función de Imágenes de ChatGPT: 4 veces más rápida y más profesional

La compañía presentó una versión renovada de ChatGPT Imágenes, impulsada por el modelo GPT-Image-1.5, que mejora la edición, el seguimiento de instrucciones y el renderizado de texto, y ya está disponible para todos los usuarios y desarrolladores a nivel global.

OpenAI dio un nuevo paso en la evolución de la generación de imágenes con inteligencia artificial al anunciar el lanzamiento de la nueva función de Imágenes de ChatGPT, impulsada por su modelo más avanzado hasta el momento, GPT-Image-1.5. La actualización ya está disponible para todos los usuarios de ChatGPT y también para desarrolladores a través de la API, y apunta a convertir a la plataforma en una herramienta creativa de uso cotidiano tanto para personas como para equipos profesionales.

Según explicó la compañía, el nuevo modelo permite generar imágenes hasta cuatro veces más rápido que la versión anterior y realizar ediciones mucho más precisas, respetando detalles clave como la iluminación, la composición y, especialmente, la apariencia de las personas. “Tanto si partes de cero como si editas una foto, ahora puedes conseguir exactamente el resultado que tienes en mente”, señala OpenAI en la presentación oficial de la función.

Edición avanzada sin perder la esencia de la imagen

Uno de los principales diferenciales de GPT-Image-1.5 es su capacidad para seguir instrucciones de manera más confiable, incluso en solicitudes complejas o con múltiples pasos. Cuando un usuario edita una imagen cargada, el modelo solo modifica aquello que se le pide, manteniendo constantes los elementos que no forman parte del cambio solicitado. Esto incluye rasgos faciales, estilo visual, iluminación y coherencia entre ediciones sucesivas.

OpenAI destaca que esta mejora habilita casos de uso más realistas, como pruebas virtuales de vestuario y peinados, retoques fotográficos precisos y transformaciones conceptuales que conservan la identidad de la imagen original. En conjunto, estas capacidades convierten a ChatGPT en lo que la compañía define como “un estudio creativo en tu bolsillo”.

El modelo se destaca en tareas de agregar, eliminar, combinar, mezclar y transponer elementos, permitiendo cambios graduales o radicales sin perder aquello que hace única a cada imagen.

Transformaciones creativas y mejor manejo del texto

Más allá de la edición puntual, GPT-Image-1.5 sobresale en transformaciones creativas que incorporan texto, diseño y estilos visuales complejos. Estas funciones pueden activarse tanto mediante prompts escritos como a través de estilos y propuestas predefinidas dentro de la nueva experiencia de Imágenes de ChatGPT, lo que reduce la barrera de entrada para usuarios sin conocimientos técnicos.

Otra mejora relevante es el renderizado de texto, un punto históricamente débil en los modelos de generación de imágenes. La nueva versión maneja mejor textos densos y de menor tamaño, permitiendo generar infografías, carteles, anuncios y visualizaciones de contenido estructurado, como artículos en Markdown, con mayor precisión y legibilidad.

Un nuevo espacio de creación dentro de ChatGPT

Junto con el nuevo modelo, OpenAI presentó un espacio dedicado a Imágenes dentro de ChatGPT, accesible desde la barra lateral tanto en la versión móvil como en chatgpt.com. Este entorno incluye filtros, prompts en tendencia y estilos preconfigurados que se actualizan regularmente para reflejar nuevas corrientes creativas.

Entre las novedades, se incorpora la posibilidad de realizar una carga única de apariencia, lo que permite reutilizar la imagen de una persona en creaciones futuras sin necesidad de volver a seleccionar fotos desde la galería. Además, las imágenes ahora se renderizan hasta cuatro veces más rápido, y los usuarios pueden generar nuevas imágenes mientras otras aún están en proceso, optimizando la exploración creativa.

Impacto en empresas y reducción de costos

GPT-Image-1.5 también apunta de lleno al uso empresarial. El modelo mejora los flujos de trabajo en marketing, diseño, comercio electrónico y comunicación interna, gracias a una mayor consistencia visual y ediciones más rápidas. OpenAI subraya que la preservación de logotipos y elementos de marca es ahora más confiable, algo clave para equipos que producen catálogos de productos o materiales promocionales a gran escala.

En términos económicos, OpenAI confirmó que las imágenes de entrada y salida cuestan un 20% menos en GPT-Image-1.5 que en la versión anterior, lo que permite a empresas y desarrolladores generar más contenido visual con el mismo presupuesto.

Compañías como Wix, Canva, Envato y Figma Weave ya están utilizando el modelo. Hila Gat, jefa de investigación de IA y ciencia de datos en Wix, afirmó: “GPT-Image-1.5 genera imágenes de alta fidelidad que siguen fielmente los prompts, preservando la composición, la iluminación y los detalles minuciosos. La consistencia y la calidad hacen de este uno de los modelos de generación de imágenes insignia en la actualidad”.

Disponibilidad y próximos pasos

La nueva función de ChatGPT Imágenes se está desplegando desde hoy a nivel mundial para todos los usuarios y funciona de manera automática, sin necesidad de seleccionar un modelo específico. OpenAI reconoce que todavía existen limitaciones —como algunas inexactitudes científicas o desafíos con múltiples rostros—, pero destaca que el modelo acierta alrededor del 70% de las veces y representa un avance significativo frente a la versión inicial.

“La generación de imágenes todavía está en una etapa temprana”, concluye la compañía, pero la actualización marca un paso firme hacia ediciones más precisas, resultados más ricos y una experiencia creativa cada vez más integrada al trabajo diario.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

WP to LinkedIn Auto Publish Powered By : XYZScripts.com