Google Anunciado hoy que está iniciando una discusión pública sobre el desarrollo de nuevos protocolos y pautas sobre cómo los sistemas de IA acceden y usan el contenido de los sitios web.
En una publicación de blog, Google quiere explorar “estándares técnicos y éticos para permitir que los editores web elijan y controlen los casos emergentes de uso de investigación e inteligencia artificial”.
El anuncio sigue a la reciente conferencia I/O de Google, donde la compañía habló sobre nuevos productos de IA y sus principios de IA, cuyo objetivo es garantizar que los sistemas de IA sean justos, transparentes y responsables.
La publicación del blog de Google dice:
“Creemos que todos se benefician de un ecosistema de contenido vibrante. La clave para eso es que los editores web tengan opciones y control significativos sobre su contenido, y oportunidades para obtener valor de participar en el ecosistema web”.
Google reconoce que los estándares técnicos como robots.txt se crearon hace casi 30 años y se desarrollaron antes que las modernas tecnologías de IA que pueden analizar datos web a gran escala.
Robots.txt permite a los editores especificar cómo los motores de búsqueda rastrean e indexan su contenido. Sin embargo, carece de mecanismos para abordar cómo los sistemas de IA pueden utilizar datos para entrenar algoritmos o desarrollar nuevos productos.
Google está invitando a miembros de las comunidades web y de IA, incluidos editores web, académicos, grupos de la sociedad civil y sus socios, a unirse a un debate público sobre el desarrollo de nuevos protocolos y pautas éticas.
Google afirma:
“Queremos que este sea un proceso abierto y esperamos que una amplia gama de partes interesadas participen para discutir cómo equilibrar el progreso de la IA con la privacidad, la agencia y el control de los datos”.
La discusión refleja un reconocimiento cada vez mayor de que las tecnologías de IA pueden aprovechar los datos web de nuevas maneras que plantean desafíos éticos con respecto al uso de datos, la privacidad y el sesgo.
Al iniciar un proceso abierto, Google apunta a una solución colaborativa que aborde los intereses de las empresas de tecnología y los creadores de contenido.
El resultado de estas discusiones podría dar forma a cómo los sistemas de IA interactúan y utilizan los datos de los sitios web en los años venideros.
“La web ha permitido mucho progreso, y la IA tiene el potencial de aprovechar ese progreso”, dice Google. “Pero tenemos que hacerlo bien”.
Críticas a los métodos de recopilación de datos de Google
El anuncio de Google se produce cuando enfrenta críticas sobre la cantidad de datos que ya ha recopilado de toda la web para entrenar sus sistemas de IA y modelos de lenguaje.
Estas prácticas de recopilación de datos se describen en una actualización de la política de privacidad de Google.
Algunos en la comunidad de SEO argumentan que el esfuerzo de Google es demasiado pequeño y demasiado tarde.
Barry Adams se burló del anuncio en Twitter, dicho:
“Ahora que ya hemos capacitado a nuestros LLM en todo su contenido patentado y protegido por derechos de autor, finalmente comenzaremos a pensar en brindarle una forma de optar por no utilizar ninguno de sus contenidos futuros para enriquecernos”.
Otros argumentan que Google necesita hacer más para recopilar comentarios en este proceso.
Nate Hake, especialista en marketing de viajes, tuiteó:
“’Comenzar una discusión’ requiere realmente dejar que la otra parte DIGA algo. Este es solo un formulario de captura de correo electrónico. No hay campo para dar comentarios. Ni siquiera un mensaje de confirmación”.
La IA se basa en los datos, pero ¿cuánto es demasiado?
Los sistemas de IA necesitan grandes cantidades de datos para funcionar, mejorar y beneficiar a la sociedad. Sin embargo, cuantos más datos tenga acceso la IA, mayores serán los riesgos para la privacidad personal.
Hay compromisos difíciles entre permitir el progreso de la IA y proteger la información de las personas.
Existe un debate sobre si las personas deberían poder excluirse de la IA utilizando sus datos públicos de redes sociales. Algunos dicen que las personas deberían controlar sus datos, mientras que otros dicen que esto frena el avance de la IA.
Ambas partes presentan argumentos válidos y estamos lejos de llegar a un consenso sobre el enfoque político correcto.
Mirando hacia el futuro
El llamado a discusión de Google es un paso en la dirección correcta, pero la empresa debe continuar implementando los comentarios que recibe.
Google no es el único que se enfrenta a estos desafíos. Cada empresa de tecnología que desarrolla IA se basa en datos recopilados de la web. La discusión debería involucrar a toda la industria tecnológica, no solo a Google.
Imagen destacada: JDres/Shutterstock
Con información de Search Engine Journal.
Leer la nota Completa > Google pide debate público sobre el uso de contenido web por parte de la IA