OpenAI lanzó ChatGPT Images 2.0 este miércoles 22 de abril, un año después de la presentación de su primera versión. En esta versión, la compañía promete avances cualitativos en el seguimiento de instrucciones detalladas, el posicionamiento de imágenes, las relaciones precisas entre objetos, la representación de texto denso y la capacidad de generar imágenes con diferentes relaciones de aspecto. También existe una versión Thinking, capaz de razonar.
La empresa afirma que la nueva versión de GPT Images ofrece resultados menos generados por IA gracias a su precisión. Es capaz de seguir instrucciones, conservar los detalles solicitados y renderizar elementos minúsculos que suelen confundir a las plantillas de imagen, como texto pequeño, iconografía y elementos de interfaz, así como composiciones complejas y sutiles restricciones estilísticas. La idea es que, con una simple indicación, la herramienta pueda generar una imagen utilizando incluso su conocimiento del mundo real para completar la información faltante.
ChatGPT Imágenes 2.0 con Pensamiento
La nueva versión del modelo de imágenes incluye una función llamada Thinking, que, según OpenAI, introduce capacidades de razonamiento por primera vez. En este caso, los usuarios de ChatGPT Images 2.0 Thinking, es decir, los suscriptores de las versiones ChatGPT Plus, Pro y Business, pueden buscar información en tiempo real en la web, crear varias imágenes distintas a partir de un solo comando y revisar sus propios resultados.
Mediante el razonamiento, el modelo cierra la brecha entre la idea y la imagen. OpenAI cree que este modelo va más allá de la representación gráfica y logra un diseño estratégico.
La versión Thinking también estará disponible a partir de este miércoles para los usuarios de ChatGPT, Codex y la API.
Cuando se activa el modo Pensamiento, el sistema trabaja de forma más profunda, utilizando funciones de análisis estructural para ejecutar la instrucción con mayor precisión.
Este modo también puede generar hasta ocho imágenes distintas a la vez, lo que facilita la creación de proyectos, como una secuencia de cómics o un conjunto de diseños, sin que el usuario tenga que ensamblar la secuencia manualmente.

Imagen creada por ChatGPT Images 2.0. Crédito: comunicado de prensa.
Estilos visuales mejorados y proporciones flexibles
ChatGPT Images 2.0 captura mejor las características que definen las fotografías, incluidas las sutiles imperfecciones que añaden realismo, así como las escenas cinematográficas, el pixel art, el manga y otros lenguajes visuales distintos, con una mayor coherencia en la textura, la iluminación y la composición.
Otra mejora importante es la relación de aspecto de la imagen, que puede variar de 3:1 (ultra ancha) a 1:3 (vertical estrecha). La plantilla genera resultados para banners, diapositivas de presentación, pantallas de móviles, marcadores y contenido para redes sociales. Cabe mencionar también que la nueva función tiene como fecha límite diciembre de 2025.
Imágenes 2.0 en el Códice
La herramienta integrada en Codex permite la creación de iconos de interfaz, conceptos y prototipos, así como la posibilidad de comparar rápidamente opciones y transformar las mejores ideas en productos o sitios web reales.
Limitaciones
ChatGPT Images 2.0 tiene dificultades para generar algunas imágenes que dependen de un modelo del mundo físico, como guías de origami, rompecabezas, cubos de Rubik y detalles que deben aparecer correctamente en superficies ocultas, inclinadas o invertidas. Los detalles densos o repetitivos, como los granos de arena, también pueden suponer un reto para el modelo, al igual que las etiquetas y los diagramas.


