Una publicación en LinkedIn cuestionó la idea de que los datos estructurados de Schema.org tengan un impacto en los resultados de un modelo de lenguaje grande. Aparentemente, hay algunos SEO que recomiendan datos estructurados para obtener una mejor clasificación en los motores de búsqueda de IA.
Patrick Stox escribió la siguiente publicación en LinkedIn:
“¿Me perdí algo? ¿Por qué los SEO creen que el marcado del esquema afectará el resultado del LLM?
Patrick dijo “resultado de LLM” en el contexto de una recomendación de SEO, por lo que es probable que sea una referencia a ChatGPT Search y otros motores de búsqueda de IA. Entonces, ¿los motores de búsqueda de IA obtienen sus datos a partir de datos estructurados?
Los LLM reciben capacitación en textos web, libros, registros gubernamentales, documentos legales y otros datos de texto (así como también en otras formas de medios) que luego se utilizan para producir resúmenes y respuestas, pero sin plagiar los datos de capacitación. Lo que eso significa es que no tiene sentido pensar que la optimización de su contenido web dará como resultado que el propio LLM envíe referencias a ese sitio web.
Los motores de búsqueda de IA se basan en índices de búsqueda (y gráficos de conocimiento) a través de la generación aumentada de recuperación (RAG). Los propios índices de los motores de búsqueda se crean a partir de datos rastreados, no de datos estructurados por esquemas.
Perplexity AI clasifica el contenido rastreado en la web utilizando una versión modificada de PageRank en su índice de búsqueda, por ejemplo. Google y Bing rastrean datos de texto y hacen cosas como eliminar contenido duplicado, eliminar palabras vacías y otras manipulaciones del texto extraído del HTML, además no todas las páginas tienen datos estructurados.
De hecho, Google sólo utiliza una fracción de los datos estructurados de Schema.org disponibles para tipos específicos de experiencias de búsqueda y resultados enriquecidos, lo que a su vez limita el tipo de datos estructurados que utilizan los editores.
Luego está el hecho de que tanto los rastreadores de Bing como los de Google procesan el HTML, identifican los encabezados, pies de página y el contenido principal (de donde extraen el texto para fines de clasificación). ¿Por qué harían eso si van a depender de datos estructurados de Schema, verdad?
La idea de que es bueno utilizar los datos estructurados de Schema.org para obtener una mejor clasificación en un motor de búsqueda de IA no se basa en hechos, es sólo una especulación fantasiosa. O podría ser un efecto de “juego de teléfono” en el que una persona dice algo y veinte personas más tarde se transforma en algo completamente diferente.
Por ejemplo, Jono Alderson propuso que los datos estructurados podrían ser un estándar que los motores de búsqueda de IA podrían utilizar para comprender mejor la web. No estaba diciendo que los motores de búsqueda con IA lo utilicen actualmente, simplemente estaba proponiendo que los motores de búsqueda con IA deberían considerar adoptarlo y tal vez esa publicación se convirtió en una teoría completa veinte SEO después.
Desafortunadamente, hay muchas ideas infundadas flotando en los círculos de SEO. El otro día vi a un SEO afirmar en las redes sociales que la búsqueda local de Google no utiliza direcciones IP en respuesta a consultas de búsqueda “cerca de mí”. Todo lo que todos tuvieron que hacer para probar esa idea es iniciar sesión en una VPN, elegir una ubicación geográfica para su dirección IP y hacer una consulta de búsqueda “cerca de mí” y verán que la dirección IP utilizada por la VPN influyó en el “cerca de mí”. ”resultados de búsqueda.
Captura de pantalla de la consulta cercana a mí influenciada por la dirección IP
Google incluso publica una página de soporte que dice que usan la dirección IP para personalizar los resultados de búsqueda, pero hay personas que creen lo contrario porque algunos SEO hicieron un estudio de correlación y cuando nos preguntan, volvemos a alguien gritando que Google miente.
¿Creerás en tus ojos mentirosos?
Resultados de búsqueda de IA y datos estructurados de Schema.Org
Los “SEO” que recomiendan que los editores utilicen datos estructurados de Schema.org para los datos de capacitación de LLM tampoco tiene sentido porque los datos de capacitación no se citan en los resultados de LLM, solo para los resultados que se obtienen de la web, que a su vez proviene de un índice de búsqueda que de un rastreador. Como se mencionó anteriormente, los editores solo usan una fracción de los datos estructurados disponibles de Schema.org porque el propio Google solo usa una pequeña fracción de ellos. Por lo tanto, no tiene sentido que un motor de búsqueda de IA dependa de datos estructurados para su producción.
El experto en marketing de búsqueda Christopher Shin (perfil de LinkedIn) comentó:
“Pensé lo mismo después de leer tu publicación, Patrick. Así lo interpreto actualmente. Pensé que los LLM normalmente no generan respuestas de los motores de búsqueda, sino de la interpretación de datos. ¿Bien? Pero los SER utilizarían el marcado de datos de esquema para mostrar fragmentos enriquecidos, etc., ¿no? Creo que el matiz clave con el esquema y los LLM es que los motores de búsqueda usan esquemas para las SERP, mientras que los LLM usan interpretación de datos cuando se trata de cómo el esquema afecta a los LLM “.
Personas como Christopher Shin y Patrick Stox me dan la esperanza de que el SEO pragmático y sensato todavía esté luchando por superar el ruido, la publicación de Patrick en LinkedIn es prueba de ello.
SEO pragmático
La definición de pragmático es hacer las cosas por razones sensatas y realistas y no en opiniones basadas en información y conjeturas incompletas.
Hablando como alguien que ha estado involucrado con SEO desde prácticamente su nacimiento, no pensar detenidamente es la razón por la que los SEO y los editores tradicionalmente han perdido el tiempo con problemas vagamente definidos, haciendo girar sus ruedas en actividades inútiles como señales superficiales de EEAT, etc., etc. . Es realmente desalentador señalar documentación y declaraciones oficiales y recibir la respuesta con declaraciones como “Google miente”. Ese tipo de actitud hace que una persona “quiera gritar”.
Un SEO un poco más pragmático por favor.
Con información de Search Engine Journal.
Leer la nota Completa > Los SEO recomiendan datos estructurados para la búsqueda con IA… ¿Por qué?