Cerrando la distancia entre lo que está en tu mente y tu capacidad de darle vida con ChatGPT Images y más. Por Fidji Simo
Los humanos no solo pensamos con palabras. De hecho, algunas de nuestras ideas más cautivadoras suelen surgir como imágenes, sonidos, movimientos y patrones en nuestra mente. Para que la IA nos ayude a alcanzar nuestro máximo potencial, necesita comunicarse de maneras que se ajusten a nuestra forma natural de absorber y procesar el mundo.
En los últimos meses, he hablado sobre cómo ChatGPT está evolucionando de un producto reactivo basado en texto a algo más intuitivo y conectado a cualquier tarea que desees realizar. La transición del texto a la interfaz multimedia y dinámica es una parte importante de esa transformación, y estoy entusiasmado con el progreso que estamos logrando.
La primera experiencia de muchos con ChatGPT consiste en convertir una indicación de texto en una imagen. Es una forma mágica de ver lo que esta tecnología puede hacer, pero la interfaz de chat no se diseñó originalmente para esto. Crear y editar imágenes es una tarea diferente y merece un espacio dedicado a lo visual. Hoy lanzamos un nuevo modelo de generación de imágenes y un punto de acceso dedicado en ChatGPT para imágenes que funciona como un estudio creativo. Las nuevas pantallas de visualización y edición de imágenes facilitan la creación de imágenes que se ajusten a tu visión o te inspiran con indicaciones de moda y filtros preestablecidos. Además, nuestro nuevo modelo es más rápido y mejor al seguir instrucciones detalladas, lo que te permite realizar ediciones más precisas y transformaciones creativas. Mantiene la coherencia de elementos clave como la iluminación, la composición y la semejanza entre las entradas y las salidas, para que los resultados se acerquen mucho más a lo que imaginaste.

Hay muchos otros casos de uso que pueden beneficiarse de interfaces que van más allá del texto. Por ejemplo, al investigar productos o restaurantes, no solo quieres un informe con las opciones, sino también fotos y especificaciones comparativas que te ayuden a decidir. Al aprender sobre nuevos temas, quieres poder profundizar sin perder tu lugar en la conversación. Estamos mejorando las respuestas para incorporar más elementos visuales con fuentes claras y nuevas formas de obtener contexto adicional. Próximamente, las respuestas empezarán a destacar personas, lugares y productos importantes, que podrás tocar para obtener más información al instante sin tener que hacer preguntas adicionales. Podrás destacar cualquier palabra o frase en una respuesta y ChatGPT te dará más información.

La misma idea aplica a otras tareas cotidianas. Para cosas como convertir medidas u obtener resultados deportivos, necesitas una respuesta visual rápida que puedas asimilar de un vistazo. (Esto le vendrá genial a mi esposo, que suele hacer ambas cosas en la cocina). Estamos implementando varias utilidades de este tipo en ChatGPT y seguiremos añadiendo más con el tiempo.

También estamos mejorando la escritura en ChatGPT. Aunque la escritura se basa en texto, existen elementos de diseño importantes que pueden mejorar la experiencia. Nuestra primera versión de Canvas tuvo gran aceptación como herramienta de escritura, pero te distraía del flujo de la conversación. Estamos trabajando en la integración de bloques de escritura dentro del chat, para que puedas editar en línea o cambiar al modo de pantalla completa cuando lo necesites. También empezarás a ver opciones más relevantes según lo que estés escribiendo, así que cuando estés redactando un informe, te facilitaremos la descarga de un PDF o un documento de Word. Si recibes ayuda con un correo electrónico o un mensaje de texto, te facilitaremos la apertura de la versión final en tu correo electrónico o aplicación de mensajería.

Las apps en ChatGPT son otra forma de brindar experiencias ricas e interactivas a tus conversaciones para que puedas usar las herramientas adecuadas y actuar. A principios de este año, presentamos apps de socios como Booking.com, Canva, Coursera, Expedia, Figma, Spotify y Zillow. Próximamente, habrá aún más apps disponibles en un nuevo directorio, incluyendo Adobe, Airtable, Apple Music, Clay, Lovable, OpenTable, Replit y Salesforce, y otros desarrolladores podrán enviar sus apps para revisión. Sabemos que no podemos desarrollarlo todo nosotros mismos, y ChatGPT es aún más útil cuando puede conectarse a los servicios que ya usas y mostrar la herramienta adecuada en el momento oportuno.
En todas estas áreas y otras futuras, es emocionante ver cómo ChatGPT evoluciona de ser principalmente textual y conversacional a una interfaz de usuario totalmente generativa que incorpora los componentes adecuados según tus necesidades. Al crear, deberías poder ver y dar forma a lo que estás creando. Cuando las imágenes cuentan una historia mejor que las palabras, ChatGPT debería incluirlas. Cuando necesitas una respuesta rápida o el siguiente paso reside en otra herramienta, debería estar ahí mismo. Al hacerlo, podemos seguir acortando la distancia entre lo que tienes en la mente y tu capacidad para darle vida.
Fuente: https://fidjisimo.substack.com/

