Microsoft está poniendo a disposición del público una nueva tecnología llamada GraphRAG, que permite a los chatbots y motores de respuesta conectar los puntos en un conjunto de datos completo, superando al estándar de recuperación aumentada (RAG) por amplios márgenes.
¿Cuál es la diferencia entre RAG y GraphRAG?
RAG (Recuperación-Generación Aumentada) es una tecnología que permite a un LLM acceder a una base de datos como un índice de búsqueda y utilizarla como base para responder una pregunta. Se puede utilizar para unir un modelo de lenguaje grande y un índice de motor de búsqueda convencional.
El beneficio de RAG es que puede utilizar datos autorizados y confiables para responder preguntas. RAG también permite que los chatbots de IA generativa utilicen información actualizada para responder preguntas sobre temas en los que el LLM no recibió capacitación. Este es un enfoque que utilizan los motores de búsqueda de inteligencia artificial como Perplexity.
La ventaja de RAG está relacionada con el uso de incrustaciones. Las incrustaciones son una forma de representar las relaciones semánticas entre palabras, oraciones y documentos. Esta representación permite que la parte de recuperación de RAG haga coincidir una consulta de búsqueda con el texto de una base de datos (como un índice de búsqueda).
Pero la desventaja de utilizar incrustaciones es que limita el RAG a hacer coincidir texto a nivel granular (en lugar de un alcance global a través de los datos).
Microsoft explica:
“Dado que el ingenuo RAG solo considera los k fragmentos de texto de entrada más similares, falla. Peor aún, comparará la pregunta con fragmentos de texto que son superficialmente similares a esa pregunta, lo que dará como resultado respuestas engañosas”.
La innovación de GraphRAG es que permite a un LLM responder preguntas basadas en el conjunto de datos general.
Lo que hace GraphRAG es crear un gráfico de conocimiento a partir de los documentos indexados, también conocidos como datos no estructurados. El ejemplo obvio de datos no estructurados son las páginas web. Entonces, cuando GraphRAG crea un gráfico de conocimiento, está creando una representación “estructurada” de las relaciones entre varias “entidades” (como personas, lugares, conceptos y cosas) que luego las máquinas entienden más fácilmente.
GraphRAG crea lo que Microsoft llama “comunidades” de temas generales (alto nivel) y temas más granulares (bajo nivel). Luego, un LLM crea un resumen de cada una de estas comunidades, un “resumen jerárquico de los datos” que luego se utiliza para responder preguntas. Este es un gran avance porque permite que un chatbot responda preguntas basadas más en el conocimiento (los resúmenes) que en las incrustaciones.
Así lo explica Microsoft:
“El uso de un LLM para resumir cada una de estas comunidades crea un resumen jerárquico de los datos, proporcionando una descripción general de un conjunto de datos sin necesidad de saber qué preguntas hacer de antemano. Cada comunidad sirve como base para un resumen comunitario que describe sus entidades y sus relaciones.
…Los resúmenes de la comunidad ayudan a responder estas preguntas globales porque el índice gráfico de descripciones de entidades y relaciones ya ha considerado todos los textos de entrada en su construcción. Por lo tanto, podemos utilizar un enfoque de reducción de mapas para responder preguntas que conserve todo el contenido relevante del contexto de datos global…”
Ejemplos de RAG versus GraphRAG
El artículo de investigación original de GraphRAG ilustró la superioridad del enfoque GraphRAG al poder responder preguntas para las cuales no hay datos de coincidencia exacta en los documentos indexados. El ejemplo utiliza un conjunto de datos limitado de noticias rusas y ucranianas del mes de junio de 2023 (traducido al inglés).
Pregunta simple de coincidencia de texto
La primera pregunta que se utilizó como ejemplo fue “¿Qué es Novorossia?”Y tanto RAG como GraphRAG respondieron la pregunta, y GraphRAG ofreció una respuesta más detallada.
Por cierto, la respuesta breve es que “Novorossiya” se traduce como Nueva Rusia y es una referencia a las tierras ucranianas que fueron conquistadas por Rusia en el siglo XVIII.
La segunda pregunta de ejemplo requería que la máquina estableciera conexiones entre conceptos dentro de los documentos indexados, lo que Microsoft llama una “tarea de resumen centrado en consultas (QFS)”, que es diferente a una simple tarea de recuperación basada en texto. Requiere lo que Microsoft llama “conectar los puntos”.
La pregunta formulada sobre los sistemas RAG y GraphRAG:
“¿Qué ha hecho Novorossiya?”
Esta es la respuesta del RAG:
“El texto no proporciona información específica sobre lo que ha hecho Novorossiya”.
GraphRAG respondió a la pregunta “¿Qué ha hecho Novorossiya?” con una respuesta de dos párrafos que detalla los resultados del movimiento político Novorossiya.
Aquí hay un breve extracto de la respuesta de dos párrafos:
“Novorossiya, un movimiento político en Ucrania, ha estado involucrado en una serie de actividades destructivas, particularmente dirigidas a varias entidades en Ucrania. [Entities (6494, 912)]. El movimiento se ha relacionado con planes para destruir propiedades de varias entidades ucranianas, entre ellas Rosen, la fábrica de conservas de Odessa, el centro regional de transmisión de radiotelevisión de Odessa y la Compañía Nacional de Televisión de Ucrania. [Relationships (15207, 15208, 15209, 15210)]…
…La Oficina del Fiscal General de Ucrania ha informado sobre la creación de Novorossiya, indicando la conciencia del gobierno y la posible preocupación por las actividades de este movimiento…”
Lo anterior es solo parte de la respuesta que se extrajo del conjunto de datos limitado de un mes, que ilustra cómo GraphRAG puede conectar los puntos en todos los documentos.
GraphRAG ahora disponible públicamente
Microsoft anunció que GraphRAG está disponible públicamente para que cualquiera pueda usarlo.
“Hoy, nos complace anunciar que GraphRAG ahora está disponible en GitHub y ofrece una recuperación de información más estructurada y una generación de respuestas integral que los enfoques ingenuos de RAG. El repositorio de código GraphRAG se complementa con un acelerador de soluciones, que proporciona una experiencia API fácil de usar alojada en Azure que se puede implementar sin código con unos pocos clics”.
Microsoft lanzó GraphRAG para hacer que las soluciones basadas en él sean más accesibles públicamente y fomentar comentarios para mejorar.
Lea el anuncio:
GraphRAG: nueva herramienta para el descubrimiento de datos complejos ahora en GitHub
Imagen destacada del estudio Shutterstock/Deemerwha
Con información de Search Engine Journal.
Leer la nota Completa > GraphRAG es un RAG mejor y ahora es gratis