OpenAI ha vuelto a causar sensación en el mundo de la tecnología con su última innovación: GPT-4 con Vision o GPT-4V.
Visión de GPT-4 para escribir código con un diseño: https://t.co/xJy9yFNvKG
-Greg Brockman (@gdb) 27 de septiembre de 2023
GPT-4V se basa en GPT-4 e incorpora capacidades visuales, lo que permite que el modelo analice imágenes proporcionadas por los suscriptores de ChatGPT Plus y Enterprise.
¡Lanzamiento para usuarios pagos durante las próximas dos semanas!
-Greg Brockman (@gdb) 27 de septiembre de 2023
La nueva característica tiene un gran potencial pero también conlleva algunos riesgos para las empresas.
GPT-4 con ejemplos de visión
A medida que más usuarios obtienen acceso a la nueva función, comparten ejemplos de cómo funciona GPT-4 con Vision.
GPT-4 con Vision puede analizar la escritura a mano.
Muy genial. La IA es mejor que yo para descifrar la escritura a mano.
El profesor Breen preguntó si el GPT-4 con visión puede leer el manuscrito de Robert Boyle. ¡Lo hace bien!
Probablemente será un gran problema para varios campos académicos, especialmente porque la IA puede “razonar” sobre el texto. https://t.co/n9jUjqeEw3 pic.twitter.com/78jYWfIhCY
– Ethan Mollick (@emollick) 27 de septiembre de 2023
Puede crear código para un sitio web utilizando un dibujo de servilleta.
Es increíble cómo la gente usa GPT-4 con Vision.
pic.twitter.com/1O3AW7DJDr-Hushen Savani (@hushensavani) 27 de septiembre de 2023
Puede analizar memes.
Esto es absolutamente salvaje. Estoy completamente sin palabras. pic.twitter.com/wGTAx1hFgS
– Pietro Schirano (@skirano) 27 de septiembre de 2023
Además de estos ejemplos, realicé algunas pruebas sencillas.
GPT-4 con Vision puede escribir descripciones de productos para sus páginas de ventas y listados de Amazon.
Puede ayudarle a comenzar con la codificación básica para un diseño de sitio web en particular basándose en una captura de pantalla.
Puede escribir subtítulos creativos de Instagram con sugerencias de hashtags.
Puede escribir un artículo basado en datos de un sitio web o libro electrónico, como el Estado del SEO 2024.
Al igual que con todo el contenido generado por IA, es esencial revisar la precisión de los resultados de GPT-4 con Vision. Todavía alucina y plantea otros riesgos.
OpenAI revela riesgos potenciales de GPT-4V
OpenAI publicó un documento que describe los riesgos potenciales asociados con el uso de GPT-4V, que incluyen:
- Riesgos de privacidad al identificar personas en imágenes o determinar su ubicación, lo que potencialmente afecta las prácticas de datos y el cumplimiento de las empresas. El documento señala que GPT-4V tiene cierta capacidad para identificar figuras públicas y geolocalizar imágenes.
- Los posibles sesgos durante el análisis y la interpretación de imágenes podrían afectar negativamente a diferentes grupos demográficos.
- Riesgos para la seguridad al proporcionar consejos médicos inexactos o poco confiables, instrucciones específicas para tareas peligrosas o contenido de odio/violento.
- Vulnerabilidades de ciberseguridad como la resolución de CAPTCHA o jailbreak multimodal.
Los riesgos que plantea el modelo se han traducido en limitaciones, como su negativa a ofrecer análisis de imágenes con personas.
En general, las marcas interesadas en aprovechar GPT-4V para marketing deben evaluar y mitigar estos y otros riesgos generativos del uso de IA para utilizar la tecnología de manera responsable y evitar impactos negativos en los consumidores y la reputación de la marca.
El primer socio de OpenAI en preparar la entrada de imágenes para una “mayor disponibilidad”
OpenAI anunció que el modelo GPT-4 con Vision impulsará Be My Eyes Virtual Volunteer, un asistente visual digital diseñado para personas con discapacidad visual.
Aunque la tecnología todavía está en fase beta, las posibilidades son tentadoras. Por ejemplo, esta tecnología podría ayudar a las empresas a mejorar la accesibilidad en el servicio al cliente.
Be My Eyes planea realizar una prueba beta de la función con clientes corporativos, enfatizando su potencial comercial más allá de su audiencia principal.
El futuro de GPT-4 con visión
Las aplicaciones potenciales de GPT-4 With Vision para empresas, especialistas en marketing y profesionales de SEO podrían ser innovadoras.
Sin embargo, todos los usuarios deben ser cautelosos debido a los posibles problemas de privacidad, equidad y ciberseguridad que plantea GPT-4 con Vision y otros modelos de IA.
Imagen de portada: Tada Images/Shutterstock
Con información de Search Engine Journal.
Leer la nota Completa > Ejemplos, limitaciones y riesgos potenciales