La carrera de los chatbots se está adentrando cada vez más en el terreno de los documentos digitales.
Brave, el navegador centrado en la privacidad, ha agregado más formas para que su asistente de inteligencia artificial “Leo” ayude a los usuarios a leer archivos PDF, analizar archivos de Google Drive y transcribir videos de YouTube. Otras características incluyen analizar código en GitHub y resumir mensajes en Slack.
Al leer páginas en Google Docs y Google Sheets, Brave utiliza una técnica llamada reconocimiento óptico de caracteres, que permite a Leo ver todo lo que ve un usuario. Para los archivos PDF, utiliza metadatos para comprender la estructura semántica basada en el árbol de accesibilidad de un archivo, que a menudo utilizan los lectores de pantalla en dispositivos para ayudar a las personas con discapacidades.
Se accede a Brave, que es de propiedad privada, desde la barra lateral del navegador. También se integra con la búsqueda para que los usuarios puedan chatear con Leo para aprender más sobre un tema del sitio web, examinar posibles sesgos o explorar diferentes puntos de vista. Según Brian Bondy, cofundador y CTO de Brave, el objetivo es hacer de Leo “la mejor opción después de hablar con la persona que escribió el artículo y poder hacer preguntas al respecto”. Brave fue cofundada por Brendan Eich, quien también inventó JavaScript y cofundó Mozilla.
“Brave siempre ha sido un agente de usuario”, dijo Bondy. “Es como un software del lado del cliente que funciona para el usuario y no para el operador del servidor. Pero el objetivo de Leo es básicamente brindarle al usuario una visión más íntima de un artículo que está leyendo o de cualquier contenido que esté leyendo”.
Después de entrenar originalmente a Leo en los modelos Llama AI de código abierto de Meta, Brave cambió en enero a modelos de Mistral AI, una startup francesa de IA fundada por ex investigadores de Meta y Google. Según Bondy, el uso de Llama 2-13-B tenía una mayor tasa de alucinaciones que el Mixtral 8x7B de Mistral. Añadió que Brave está en el proceso de integrar la búsqueda de Brave detrás de escena, lo que podría ayudar a verificar las respuestas de Leo y “dirigirlas en la dirección correcta”.
Leo no es tan famoso como ChatGPT, Copilot y Gemini. Pero Brave, que estrenó su bot en noviembre pasado, tiene una serie de funciones de privacidad para Leo que podrían atraer a los usuarios preocupados por la privacidad. Si bien Leo solo está disponible para computadoras de escritorio por ahora, la compañía dice que llegará una versión móvil para Android “muy pronto”, y luego para iOS de Apple.
A Brave también le falta algo más que tienen otros chatbots: no utiliza anuncios dirigidos. Esto es así por diseño, lo que podría resultar atractivo para algunos usuarios que no quieren preocuparse de ser rastreados por Meta, Google o Microsoft.
“En realidad, no estamos entrenando modelos desde cero”, afirmó Bondy. “Simplemente estamos conectando a los usuarios con los mejores modelos existentes a los que podemos acceder. No estamos en el juego de la recopilación de datos y cosas así”.
Sin embargo, eso no significa que Brave no esté considerando formas de agregar anuncios a Leo. Según su hoja de ruta para Leo, la empresa “puede ofrecer una opción con publicidad que preserve la privacidad” para las personas que no quieran pagar por una versión de suscripción. También podría agregar formas para que el modelo ayude a los usuarios a “ayudar a los usuarios a tomar decisiones de compra” basadas en información contextual.
Si alguien quiere utilizar otros modelos de IA, por ejemplo Claude Instant de Anthropic, Brave proporciona acceso a través de API pero lo aloja detrás de un proxy inverso. De esa manera, las direcciones IP se eliminan y las preguntas se pueden enviar de forma anónima al servidor de chat. Brave también dice que los datos personales no son almacenados por un modelo de IA ni por ningún proveedor externo.
Empresas como OpenAI han agregado recientemente formas para que ChatGPT recuerde conversaciones. Sin embargo, las respuestas de Leo se eliminan una vez enviadas y las conservaciones no se guardan en los servidores de Brave. En cambio, Brave está buscando formas alternativas de almacenar conversaciones que tengan en cuenta la privacidad. Por ejemplo, Bondy dijo que podría considerar agregar almacenamiento fuera de línea, precargar modelos de lenguaje grandes con información relevante y precargar asistentes de inteligencia artificial como Leo con información estructurada.
Brave no estuvo solo en sus esfuerzos esta semana. Otras empresas de tecnología también agregaron nuevas funciones para analizar documentos con la ayuda de chatbots. El martes, Adobe agregó un nuevo asistente de inteligencia artificial a Acrobat y Reader para generar resúmenes, analizar documentos y encontrar respuestas. Un día después, Google anunció planes para llevar sus herramientas empresariales de Duet AI bajo su paraguas Gemini como Gemini Workspace, al presentar un nuevo modelo de IA de código abierto llamado Gemma.
“La IA generativa ofrece la promesa de experiencias de documentos más inteligentes al transformar la información dentro de los archivos PDF en contenido procesable, de conocimiento y de apariencia profesional”, dijo Abhigyan Modi, vicepresidente senior de Document Cloud de Adobe, en una publicación de blog sobre las actualizaciones. “El PDF es el estándar de facto para los documentos más importantes del mundo y las capacidades introducidas hoy son sólo el comienzo”.
Con información de Digiday
Leer la nota Completa > Brave Browser incorpora nuevas funciones de lectura de IA a su chatbot centrado en la privacidad