Recientemente, a Google se le concedió una patente para clasificar páginas web, que puede ofrecer información sobre cómo AI Overviews clasifica el contenido. La patente describe un método para clasificar páginas en función de lo que podría interesarle a un usuario a continuación.
Estimación contextual de la ganancia de información del enlace
El nombre de la patente es Estimación contextual de ganancia de información de enlaces, se presentó en 2018 y se concedió en junio de 2024. Se trata de calcular una puntuación de clasificación llamada ganancia de información que se utiliza para clasificar un segundo conjunto de páginas web que probablemente sean de interés para un usuario como un tema de seguimiento ligeramente diferente relacionado con una pregunta anterior.
La patente comienza con descripciones generales y luego agrega capas de detalles a lo largo de los párrafos. Una analogía puede ser que es como una pizza. Comienza como una pizza de mozzarella, luego le agregan champiñones, así que ahora es una pizza de champiñones. Luego le añaden cebolla, así que ahora es una pizza de champiñones y cebolla. Hay capas de detalles que se acumulan en todo el contexto.
Entonces, si lees solo una sección, es fácil decir: “Es claramente una pizza de champiñones.”y estar completamente equivocado acerca de lo que realmente es.
Hay capas de contexto, pero lo que se está acumulando es:
- Clasificar una página web que sea relevante para lo que podría interesarle a un usuario próximo.
- El contexto de la invención es un asistente automatizado o chatbot.
- Un motor de búsqueda desempeña un papel similar al de las descripciones generales de IA de Google
Obtención de información y SEO: ¿Qué está pasando realmente?
Hace un par de meses leí un comentario en las redes sociales que afirmaba que la “obtención de información” era un factor importante en una reciente actualización del algoritmo central de Google. Esa mención me sorprendió porque nunca antes había oído hablar de la obtención de información. Le pregunté a algunos amigos SEO sobre esto y ellos tampoco habían oído hablar de él.
Lo que la persona en las redes sociales había afirmado era algo así como que Google estaba usando una puntuación de “Ganancia de información” para mejorar la clasificación de las páginas web que tenían más información que otras páginas web. Entonces la idea era que era importante crear páginas que tuvieran más información que otras páginas, algo parecido.
Entonces leí la patente y descubrí que la “ganancia de información” no se trata de clasificar páginas con más información que otras. En realidad se trata de algo que es más profundo para el SEO porque podría ayudar a comprender una dimensión de cómo AI Overviews podría clasificar las páginas web.
TL/DR de la patente de obtención de información
De qué se trata realmente la patente de obtención de información es aún más interesante porque puede dar una indicación de cómo AI Overviews (AIO) clasifica las páginas web que podrían interesar a un usuario a continuación. Es algo así como introducir la personalización al anticipar lo que le interesará a un usuario a continuación.
La patente describe un escenario en el que un usuario realiza una consulta de búsqueda y el asistente automatizado o chatbot proporciona una respuesta relevante a la pregunta. El sistema de puntuación de obtención de información funciona en segundo plano para clasificar un segundo conjunto de páginas web que son relevantes para lo que el usuario podría interesar a continuación. Es una nueva dimensión en la forma en que se clasifican las páginas web.
El énfasis de la patente en los asistentes automatizados
Existen varias versiones de la patente de obtención de información que datan de 2018 a 2024. La primera versión es similar a la última versión y la diferencia más significativa es la adición de chatbots como contexto en el que se utiliza la invención de obtención de información.
La patente utiliza la frase “asistente automatizado” 69 veces y utiliza la frase “motor de búsqueda” sólo 25 veces. Al igual que con AI Overviews, los motores de búsqueda desempeñan un papel en esta patente, pero generalmente en el contexto de asistentes automatizados.
Como resultará evidente, no hay nada que sugiera que una página web que contiene más información que la competencia tenga más probabilidades de obtener una clasificación más alta en los resultados de búsqueda orgánicos. De eso no habla esta patente.
Descripción general del contexto
Todas las versiones de la patente describen la presentación de los resultados de la búsqueda en el contexto de un asistente automatizado y respuesta a preguntas en lenguaje natural. La patente comienza con una descripción general y progresivamente se vuelve más específica. Esta es una característica de las patentes en el sentido de que solicitan protección en los contextos más amplios en los que la invención puede utilizarse y volverse progresivamente específica.
Toda la primera sección (el Resumen) ni siquiera menciona páginas web o enlaces. Se trata solo de la puntuación de obtención de información dentro de un contexto muy general:
“Una puntuación de ganancia de información para un documento determinado es indicativa de información adicional que se incluye en el documento más allá de la información contenida en los documentos que fueron vistos previamente por el usuario”.
Esta es una descripción resumida de la patente, y la idea clave es que la puntuación de la obtención de información se produce en las páginas después de que el usuario ha visto los primeros resultados de la búsqueda.
Contexto más específico: asistentes automatizados
El segundo párrafo de la sección titulada “Antecedentes” es un poco más específico y agrega una capa adicional de contexto para la invención porque menciona enlaces. Específicamente, se trata de un usuario que realiza una consulta de búsqueda y recibe enlaces a los resultados de la búsqueda; aún no se ha calculado la puntuación de ganancia de información.
La sección de Antecedentes dice:
“Por ejemplo, un usuario puede enviar una solicitud de búsqueda y recibir un conjunto de documentos y/o enlaces a documentos que respondan a la solicitud de búsqueda enviada”.
La siguiente parte se basa en que un usuario haya realizado una consulta de búsqueda:
“Además, por ejemplo, a un usuario se le puede proporcionar un documento basado en intereses identificados del usuario, documentos vistos previamente del usuario y/u otros criterios que pueden utilizarse para identificar y proporcionar un documento de interés. La información de los documentos puede proporcionarse, por ejemplo, a través de un asistente automatizado y/o como resultados a un motor de búsqueda. Además, la información de los documentos puede proporcionarse al usuario en respuesta a una solicitud de búsqueda y/o puede entregarse automáticamente al usuario en función de la búsqueda continua después de que el usuario haya finalizado una sesión de búsqueda”.
Esa última frase está mal redactada.
Aquí está la frase original:
“Además, la información de los documentos puede proporcionarse al usuario en respuesta a una solicitud de búsqueda y/o puede entregarse automáticamente al usuario en función de la búsqueda continua después de que el usuario haya finalizado una sesión de búsqueda”.
Así es como tiene más sentido:
“Además, se puede proporcionar al usuario información de los documentos… basándose en la búsqueda continua después de que el usuario haya finalizado una sesión de búsqueda”.
La información proporcionada al usuario es “en respuesta a una solicitud de búsqueda y/o puede ser entregada automáticamente al usuario”
Es un poco más claro si lo pones entre paréntesis:
Además, la información de los documentos puede proporcionarse al usuario (en respuesta a una solicitud de búsqueda y/o puede entregarse automáticamente al usuario) basándose en la búsqueda continua después de que el usuario haya finalizado una sesión de búsqueda.
Conclusiones:
- La patente describe la identificación de documentos que son relevantes para los “intereses del usuario” basándose en “documentos vistos anteriormente” “y/u otros criterios”.
- Establece un contexto general de un asistente automatizado “y/o“un motor de búsqueda
- La información de los documentos que se basa en “documentos vistos anteriormente” “y/u otros criterios” puede mostrarse después de que el usuario continúe con la búsqueda.
Contexto más específico: chatbot
A continuación, la patente agrega una capa adicional de contexto y especificidad al mencionar cómo los chatbots pueden “extraer” una respuesta de una página web (“documento”) y mostrarla como respuesta. Se trata de mostrar un resumen que contiene la respuesta, algo así como fragmentos destacados, pero dentro del contexto de un chatbot.
La patente explica:
“En algunos casos, se puede extraer un subconjunto de información del documento para presentarla al usuario. Por ejemplo, cuando un usuario entabla un diálogo hablado de persona a computadora con un proceso de software asistente automatizado (también conocido como “chatbots”, “asistentes personales interactivos”, “asistentes personales inteligentes”, “asistentes personales de voz”, “ agentes conversacionales”, “asistentes virtuales”, etc.), el asistente automatizado puede realizar varios tipos de procesamiento para extraer información destacada de un documento, de modo que el asistente automatizado pueda presentar la información en forma abreviada.
Como otro ejemplo, algunos motores de búsqueda proporcionarán información resumida de uno o más documentos responsivos y/o relevantes, además de o en lugar de enlaces a documentos responsivos y/o relevantes, en respuesta a la consulta de búsqueda de un usuario”.
La última oración suena como si describiera algo como un fragmento destacado o descripciones generales de IA donde proporciona un resumen. La oración es muy general y ambigua porque usa “y/o” y “además de o en lugar de” y no es tan específica como las oraciones anteriores. Es un ejemplo de una patente que es general por razones legales.
Clasificación del siguiente conjunto de resultados de búsqueda
La siguiente sección se llama Resumen y brinda más detalles sobre cómo la puntuación de Obtención de información representa la probabilidad de que el usuario esté interesado en el siguiente conjunto de documentos. No se trata de clasificar los resultados de búsqueda, se trata de clasificar el siguiente conjunto de resultados de búsqueda (basado en un tema relacionado).
Dice:
“Una puntuación de ganancia de información para un documento determinado es indicativa de información adicional que se incluye en el documento determinado más allá de la información contenida en otros documentos que ya se presentaron al usuario”.
Clasificación basada en el tema de las páginas web
Luego habla de presentar la página web en un navegador, leer de forma audible la parte relevante del documento o presentar de forma audible/visual un resumen del documento (“presentar de forma audible/visual información destacada extraída del documento al usuario, etc.”).
Pero la parte que es realmente interesante es la siguiente explicación sobre el uso de un tema de la página web como representación del contenido, que se utiliza para calcular la puntuación de ganancia de información.
Describe muchas formas diferentes de extraer la representación de lo que trata la página. Pero lo importante es que describe el cálculo de la puntuación de ganancia de información en función de una representación de lo que trata el contenido, como el tema.
“En algunas implementaciones, las puntuaciones de ganancia de información se pueden determinar para uno o más documentos aplicando datos indicativos de los documentos, como su contenido completo, información extraída destacada, una representación semántica (por ejemplo, una incrustación, un vector de características, una bolsa- representación de palabras, un histograma generado a partir de palabras/frases en el documento, etc.) a través de un modelo de aprendizaje automático para generar una puntuación de ganancia de información”.
La patente continúa describiendo la clasificación de un primer conjunto de documentos y el uso de puntuaciones de ganancia de información para clasificar conjuntos adicionales de documentos que anticipan preguntas de seguimiento o una progresión dentro de un diálogo de lo que le interesa al usuario.
En algunas implementaciones, el asistente automatizado puede consultar un motor de búsqueda y luego aplicar las clasificaciones de obtención de información a los múltiples conjuntos de resultados de búsqueda (que son relevantes para consultas de búsqueda relacionadas).
Existen múltiples variaciones de hacer lo mismo pero en términos generales esto es lo que describe:
“Con base en las puntuaciones de ganancia de información, la información contenida en uno o más de los nuevos documentos puede proporcionarse selectivamente al usuario de una manera que refleje la probable ganancia de información que puede obtener el usuario si se le presentara información de los documentos seleccionados.”
Lo que todas las versiones de la patente tienen en común
Todas las versiones de la patente comparten similitudes generales sobre las cuales se van añadiendo más detalles con el tiempo (como agregar cebollas a una pizza de champiñones). Lo siguiente es la base de lo que todas las versiones tienen en común.
Aplicación de la puntuación de obtención de información
Todas las versiones de la patente describen la aplicación de la puntuación de ganancia de información a un segundo conjunto de documentos que tienen información adicional más allá del primer conjunto de documentos. Evidentemente, no existe ningún criterio o información para adivinar qué va a buscar el usuario cuando inicia una sesión de búsqueda. Por lo tanto, las puntuaciones de ganancia de información no se aplican a los primeros resultados de búsqueda.
Ejemplos de pasajes que son iguales para todas las versiones:
- Se identifica un segundo conjunto de documentos que también está relacionado con el tema del primer conjunto de documentos pero que aún no han sido vistos por el usuario.
- Para cada…
Con información de Search Engine Journal.
Leer la nota Completa > Patente de “ganancia de información” de Google para clasificar páginas web