Operai ha lanzado un nuevo sistema de generación de imágenes directamente integrado con GPT-4O. Este sistema permite que la IA acceda a su base de conocimiento y contexto de conversación al crear imágenes.

Se dice que esta integración permite salidas visuales más contextualmente relevantes y precisas.

El anuncio de Openai dice:

“La generación de imágenes GPT -4O se destaca en el texto de representación con precisión, siguiendo con precisión las indicaciones y aprovechar la base de conocimiento inherente de 4O y el contexto de chat, incluida la transformación de imágenes cargadas o usarlas como inspiración visual. Estas capacidades hacen que sea más fácil crear exactamente la imagen, lo que le ayuda a comunicar de manera más efectiva a través de visualizaciones y avanzar en una generación de imágenes en una herramienta práctica con precisión y potencia”.

Aquí está todo lo que necesitas saber.

Capacidades técnicas

OpenAI destaca las siguientes capacidades de su nuevo sistema de generación de imágenes:

  1. Hace precisión hace que el texto dentro de las imágenes.
  2. Permite a los usuarios refinar imágenes a través de la conversación mientras mantiene un estilo consistente.
  3. Admite indicaciones complejas con hasta 20 objetos diferentes.
  4. Puede generar imágenes basadas en referencias cargadas.
  5. Crea imágenes utilizando información de los datos de entrenamiento de GPT-4O.

Estados Operai en su anuncio:

“Debido a que la generación de imágenes ahora es nativa de GPT – 4O, puede refinar imágenes a través de una conversación natural. GPT – 4O puede basarse en imágenes y texto en el contexto de chat, asegurando la consistencia en todo.

Ejemplos

Para demostrar consistencia del personajeaquí hay un ejemplo que muestra a un gato y luego ese mismo gato con un sombrero y monocle.

Captura de pantalla de: OpenAi.com/index/introducing-4o-image-generation/, marzo de 2025.

Aquí hay un ejemplo más práctico para los especialistas en marketing, demostrando generación de texto: Un menú de restaurante completo generado con un mensaje detallado.

Captura de pantalla de: OpenAi.com/index/introducing-4o-image-generation/, marzo de 2025.

Hay docenas más de ejemplos en la publicación de anuncio de OpenAi, muchos de los cuales contienen varias indicaciones y seguimientos.

Limitaciones

Operai admite:

“Nuestro modelo no es perfecto. Somos conscientes de múltiples limitaciones en el momento que trabajaremos para abordar a través de mejoras del modelo después del lanzamiento inicial”.

La Compañía señala las siguientes limitaciones de su nuevo sistema de generación de imágenes:

  • Curting: GPT-4O A veces cultivan imágenes largas, como carteles, demasiado de cerca en la parte inferior.
  • Alucinaciones: Este modelo puede crear información falsa, especialmente con indicaciones vagas.
  • Altos problemas de mezcla: Lucha por representar con precisión más de 10 a 20 conceptos a la vez, como una tabla periódica completa.
  • Texto multilingüe: El modelo puede tener problemas que muestran caracteres no latinos, lo que lleva a errores.
  • Edición: Las solicitudes para editar piezas de imagen específicas pueden cambiar otras áreas o crear nuevos errores. También lucha por mantener caras consistentes en imágenes cargadas.
  • Densidad de información: El modelo tiene dificultades para mostrar información detallada en tamaños pequeños.

Implicaciones de búsqueda

Esta actualización cambia la generación de imágenes de IA de usos principalmente decorativos a funciones más prácticas en negocios y comunicación.

Los sitios web pueden usar imágenes generadas por IA pero con consideraciones importantes.

Las pautas de Google no prohíben las imágenes generadas por la IA, centrándose en cambio en si el contenido proporciona valor independientemente de cómo se produzca.

Se recomienda seguir estas mejores prácticas:

  • Uso de metadatos C2PA (que GPT-4O agrega automáticamente) para mantener la transparencia
  • Agregar texto ALT adecuado para la accesibilidad e indexación
  • Asegurar que las imágenes sirvan a la intención del usuario en lugar de solo llenar el espacio
  • Creación de imágenes únicas en lugar de plantillas de IA genéricas

El defensor de la búsqueda de Google, John Mueller, ha expresado una opinión negativa con respecto a las imágenes generadas por IA. Si bien sus preferencias personales no influyen en los algoritmos de Google, pueden indicar cómo se sienten otros sobre las imágenes de IA.

Captura de pantalla de: bsky.app/profile/johnmu.com, marzo de 2025.

Tenga en cuenta que Google está implementando medidas para etiquetar imágenes generadas por IA en los resultados de búsqueda.

Disponibilidad

La función ya está disponible para los usuarios de ChatGPT con planes Plus, Pro, Team o GRATIS. El acceso para los usuarios de Enterprise y EDU estará disponible pronto.

Los desarrolladores pueden esperar el acceso a la API en las próximas semanas. Debido a las mayores necesidades de procesamiento, la generación de imágenes toma aproximadamente un minuto en promedio.


Imagen destacada: Patrickassale/Shutterstock

Con información de Search Engine Journal.

Leer la nota Completa > Operai lanza la creación de imágenes GPT-4O para todos

LEAVE A REPLY

Please enter your comment!
Please enter your name here