Un nuevo informe afirma que ChatGPT Search se puede manipular con texto oculto que incluye instrucciones que le indican a ChatGPT Search cómo responder a una respuesta. Las pruebas también mostraron que ChatGPT se puede manipular sin instrucciones, solo con el texto oculto.
La búsqueda de ChatGPT se puede manipular con texto oculto
Un informe de The Guardian describe cómo utilizaron texto oculto en un sitio web falso para engañar a ChatGPT Search y mostrarles una respuesta de texto oculto en la página web. El texto se oculta cuando la fuente coincide con el color de fondo de una página, como una fuente blanca sobre un fondo blanco.
Luego le pidieron a ChatGPT Search que visitara el sitio web y respondiera una pregunta basada en el texto del sitio. ChatGPT Search navegó por el sitio, indexó el contenido oculto y lo utilizó en la respuesta.
Primero evaluaron ChatGPT utilizando una página de control sin exploits en un sitio web de reseñas falso para probar la respuesta de ChatGPT. Leyó las reseñas y arrojó una respuesta normal.
Luego, los investigadores de The Guardian enviaron ChatGPT Search a un sitio web falso que tenía instrucciones para dar una reseña positiva y ChatGPT Search siguió las instrucciones y devolvió críticas positivas.
Los investigadores realizaron una tercera prueba con reseñas positivas escritas en texto oculto pero sin instrucciones y ChatGPT Search nuevamente arrojó críticas positivas.
Así lo explicó The Guardian:
“…cuando el texto oculto incluía instrucciones para que ChatGPT devolviera una reseña favorable, la respuesta siempre fue completamente positiva. Este fue el caso incluso cuando la página tenía críticas negativas: el texto oculto podría usarse para anular la puntuación de revisión real.
La simple inclusión de texto oculto por parte de terceros sin instrucciones también se puede utilizar para garantizar una evaluación positiva, con una prueba que incluyó reseñas falsas extremadamente positivas que influyeron en el resumen devuelto por ChatGPT”.
La prueba anterior es similar a una prueba de ChatGPT que realizó un profesor universitario de informática en marzo de 2023, donde engañó a ChatGPT diciéndole que era un experto en viajes en el tiempo.
Lo que demuestran estas pruebas es que los datos de entrenamiento de ChatGPT y el robot de búsqueda de ChatGPT ingieren texto oculto, pero también pueden manipularse para seguir instrucciones. The Guardian cita a un experto en seguridad que dice que OpenAI tuvo conocimiento del exploit y que podría estar solucionado cuando se publique el artículo.
¿Por qué se pueden manipular los motores de búsqueda con IA?
Una laguna en la búsqueda de IA es una tecnología llamada RAG (Retrieval Augmented Generation), una técnica que puede obtener información de un motor de búsqueda para que una IA pueda luego usarla para generar respuestas a preguntas de fuentes actualizadas y (presumiblemente) autorizadas. ¿Cómo determinan los motores de búsqueda de IA las páginas web autorizadas? Perplexity AI, por ejemplo, utiliza una versión modificada de PageRank para identificar páginas web confiables para citar en su motor de búsqueda de IA.
ChatGPT Search se basa en Bing pero también tiene su propio rastreador que puede recuperar información en tiempo real. Probablemente no sea descabellado especular que si un sitio está incluido en el índice de búsqueda de Bing, entonces probablemente esté incluido en ChatGPT Search, lo que debería proteger ChatGPT Search de ser influenciado por texto oculto. Presumiblemente, los sitios con texto oculto serían excluidos del índice de búsqueda de Bing. Dicho esto, es posible ocultar un sitio web para que muestre contenido diferente al robot de búsqueda ChatGPT (una lista actualizada de los robots OpenAI Search Crawler está disponible aquí).
Otras formas de manipular los motores de búsqueda de IA
Se dice que hay otras formas que los investigadores descubrieron el año pasado que aún podrían ser efectivas (Leer: Los investigadores descubren cómo hacer SEO para la búsqueda con IA). En este artículo de investigación del año pasado, los investigadores probaron nueve estrategias para influir en los motores de búsqueda de IA:
Nueve estrategias para manipular motores de búsqueda de IA
- Autoritativo: cambiar el estilo de escritura para ser más persuasivo en afirmaciones autorizadas.
- Optimización de palabras clave: agregar más palabras clave desde la consulta de búsqueda
- Adición de estadísticas: cambiar el contenido existente para incluir estadísticas en lugar de información interpretativa.
- Citar fuentes (citando fuentes confiables)
- Adición de citas: agregar citas y citas de fuentes de alta calidad
- Fácil de entender: hacer que el contenido sea más sencillo de entender.
- La optimización de la fluidez consiste en hacer que el contenido sea más articulado.
- Palabras únicas: agregar palabras menos utilizadas, raras y únicas, pero sin cambiar el significado del contenido.
- Términos técnicos: esta estrategia agrega términos técnicos y únicos siempre que tenga sentido hacerlo y sin cambiar el significado del contenido.
Los investigadores descubrieron que las tres primeras estrategias funcionaron mejor. En particular, agregar palabras clave a las páginas web ayudó mucho.
¿Se puede manipular la búsqueda de ChatGPT?
Escuché afirmaciones hechas en una conferencia de búsqueda reciente de que las descripciones generales de IA de Google podrían manipularse para mostrar ciertos productos de grandes marcas en respuesta a consultas de búsqueda. No verifiqué si eso era cierto, pero la afirmación fue hecha por una fuente confiable y autorizada. Con respecto a ChatGPT Search, he notado algunas cosas interesantes sobre qué sitios elige para mostrar información y bajo qué circunstancias, lo que podría ser una forma de influir en las clasificaciones. Por lo tanto, no es sorprendente que existan lagunas en la clasificación en la búsqueda ChatGPT. La búsqueda con IA se parece mucho a los primeros días de la búsqueda tradicional.
Imagen destacada de Shutterstock/Antonello Marangi
Con información de Search Engine Journal.
Leer la nota Completa > Búsqueda de ChatGPT manipulada con instrucciones ocultas