Una nueva investigación muestra que ChatGPT, Claude y otros sistemas de IA dejan distintivas “huellas digitales” en su escritura.

Así es como puede usar este conocimiento para identificar el contenido de IA y mejorar su producción asistida por AI-AI.

La huella digital de IA: lo que necesitas saber

Los investigadores han descubierto que los diferentes sistemas de escritura de IA producen texto con patrones únicos e identificables.

Analizando estos patrones, los investigadores lograron una precisión del 97.1% para determinar qué IA escribió una pieza particular de contenido.

El estudio (enlace PDF) dice:

“Encontramos que un clasificador basado en modelos simples de texto de ajuste fino en las salidas LLM puede lograr una precisión notablemente alta en esta tarea. Esto indica la clara presencia de idiosincrasias en LLM “.

Esto importa por dos razones:

  • Para lectores: A medida que la web se sature cada vez más con contenido generado por IA, saber cómo detectarla lo ayuda a evaluar las fuentes de información.
  • Para escritores: Comprender estos patrones puede ayudarlo a editar mejor borradores generados por IA para sonar más humanos y auténticos.

Cómo detectar contenido generado por IA por modelo

Cada sistema de IA importante tiene hábitos de escritura específicos que lo regalan.

Los investigadores descubrieron que estos patrones permanecen incluso en contenido reescrito:

“Estos patrones persisten incluso cuando los textos son reescritos, traducidos o resumidos por un LLM externo, lo que sugiere que también están codificados en el contenido semántico”.

1. Chatgpt

Frases características

  • Con frecuencia usa palabras de transición como “ciertamente”, “como” y “en general”.
  • A veces comienza respuestas con frases como “A continuación está …” o “¡seguro!”
  • Periódicamente emplea calificadores (por ejemplo, “típicamente”, “varios”, “en profundidad”).

Hábitos de formato

  • Utiliza atrevido o itálico estilo, puntos de bala y encabezados para mayor claridad.
  • A menudo incluye listas paso a paso explícitas o enumeradas para organizar la información.

Tendencias semánticas/estilísticas

  • Proporciona respuestas más detalladas, explicativas y ricas en contexto.
  • Prefiere un tono algo formal, “explicador útil”, a menudo dando detalles de fondo completos.

2. Claude

Frases características

  • Utiliza un lenguaje como “Según el texto”, “Basado en” o “Aquí hay un resumen”.
  • Tiende a incluir transiciones más cortas: “mientras”, “ambos”, “el texto”.

Hábitos de formato

  • Se basa en puntos simples de bala o listas mínimas en lugar de markdown elaborados.
  • A menudo incluye referencias directas al fragmento de mensaje o texto.

Tendencias semánticas/estilísticas

  • Ofrece explicaciones concisas y directas, centrándose en el punto clave en lugar de largos detalles.
  • Adopta una voz práctica y sucinta, priorizando la claridad sobre la elaboración.

3. Grok

Frases características

  • Puede usar palabras como “recuerda”, “poder”, “pero también” o “ayuda”.
  • Ocasionalmente comienza con “qué” o “dónde”, creando declaraciones directas.

Hábitos de formato

  • Utiliza encabezados o enumeraciones, pero puede hacerlo con moderación.
  • Es menos probable que incruste elementos de marcado ricos en comparación con ChatGPT.

Tendencias semánticas/estilísticas

  • A menudo minucioso en explicaciones, pero utiliza un estilo más “funcional”, mezclando instrucciones directas con recordatorios.
  • No depende en gran medida de las frases maticales como “sin duda” o “en general”, sino más bien conectores objetivos.

4. Géminis

Frases características

  • Conocido por usar “a continuación”, “ejemplo”, “por ejemplo”, a veces unido con “en resumen”.
  • Podría emplear indicaciones de exclamación como “¡Ciertamente! abajo.”

Hábitos de formato

  • Integra estructuras cortas de parada, como puntos de bala y encabezados ocasionales.
  • Ocasionalmente resalta las instrucciones clave en listas enumeradas.

Tendencias semánticas/estilísticas

  • Saldos de resúmenes concisos con explicaciones moderadamente detalladas.
  • Prefiere un tono claro e instruccional, a veces con un lenguaje directo como “Así es como …”

5. Deepseek

Frases características

  • Utiliza palabras como “cruciales”, “mejoras clave”, “aquí hay un desglose”, “esencialmente”, “etc.”
  • A veces incluye frases de transición como “al mismo tiempo” o “también”.

Hábitos de formato

  • Con frecuencia emplea enumeraciones y puntos de bala para la organización.
  • Puede tener énfasis en línea (por ejemplo, “,”llave mejoras ”) pero no siempre.

Tendencias semánticas/estilísticas

  • Generalmente respuestas exhaustivas que resaltan las principales conclusiones o “desgloses”.
  • Mantiene un estilo relativamente explicativo, pero puede ser más sucinto que ChatGPT.

6. Llama (versión de instrucciones)

Frases características

  • “Incluyendo”, “como”, “explicación”, “lo siguiente”, que señalan ejemplos o expansiones.
  • A veces, hace referencia a las guías paso a paso o “cómo” dentro del texto.

Hábitos de formato

  • Los niveles de uso de la redventación varían; A menudo coloca puntos importantes en listas numeradas o puntos de bala.
  • Puede incluir encabezados simples (por ejemplo, “## tema”) pero es menos probable que use formateo intrincado que ChatGPT.

Tendencias semánticas/estilísticas

  • Mantiene un tono académico algo formal, pero puede cambiar a más conversación para las instrucciones.
  • A veces ofrece un análisis o contexto más profundo (como definiciones o antecedentes) integrados en la respuesta.

7. Gemma (versión de instrucciones)

Frases características

  • Frases como “déjame”, “saber si” o “recordar” a menudo aparecen.
  • Tiende a incluir “a continuación es”, “específico” o “detallado” dentro de las aclaraciones.

Hábitos de formato

  • Similar a Llama, con frecuencia usa puntos de bala, enumeraciones y cascos ocasionalmente audaces.
  • Puede incorporar transiciones (por ejemplo, “puntos clave ##”) al segmento de contenido.

Tendencias semánticas/estilísticas

  • Combina instrucciones directas con detalles explicativos.
  • A menudo parcial a un enfoque más narrativo, haciendo referencia a cómo o por qué se realiza una tarea.

8. Qwen (versión para instrucciones)

Frases características

  • Incluye “ciertamente”, “en resumen” o “título” para encabezados.
  • Puede aparecer con transiciones como “integral”, “basado” o “uso de ejemplo”.

Hábitos de formato

  • Utiliza listas (a veces anidadas) para mayor claridad.
  • Periódicamente incluye bloques de código cortos o formato de fragmento para explicaciones técnicas.

Tendencias semánticas/estilísticas

  • Detallado, con énfasis en instrucciones paso a paso o puntos marcados con bala.
  • Paráfrasis-Construyendo la estructura, lo que significa que puede reformular o reorganizar el contenido ampliamente si se solicita.

9. Mistral (versión de instrucciones)

Frases características

  • Palabras como “crear”, “absolutamente”, “sujeto” o “sí” pueden aparecer temprano en las respuestas.
  • Tiende a confiar en los verbos directos para los comandos (por ejemplo, “prueba”, “construir”, “prueba”).

Hábitos de formato

  • Por lo general, se aplica puntos de bala sencillos sin una reducción pesada.
  • Ocasionalmente incluye encabezados, pero a menudo mantiene la estructura mínima.

Tendencias semánticas/estilísticas

  • Prefiere instrucciones concisas, directas o descripción general.
  • Se centra en la brevedad y aún pretende ser minucioso, dando detalles centrales de manera organizada.

Cómo hacer que el contenido generado por IA sea más humano

El estudio reveló que la elección de palabras es un identificador primario del texto generado por IA:

“Después de barajar aleatoriamente las palabras en las respuestas generadas por LLM, observamos una disminución mínima en la precisión de clasificación. Esto sugiere que una porción sustancial de características distintivas está codificada en la distribución de nivel de palabra “.

Si está utilizando herramientas de escritura de IA, aquí hay pasos prácticos para reducir estos patrones reveladores:

  • Varía tus comienzos: La investigación encontró que las primeras palabras son altamente predecibles en el contenido de IA. Edite oraciones de apertura para evitar típicos entrantes de IA.
  • Reemplazar frases características: Esté atento y reemplace las frases específicas del modelo mencionadas anteriormente.
  • Ajustar patrones de formato: Cada IA ​​tiene preferencias de formato distintas. Modifique estos para romper los patrones reconocibles.
  • Contenido de reestructuración: AI tiende a seguir una organización predecible. Reorganizar secciones para crear un flujo más único.
  • Agregar elementos personales: Incorpore sus propias experiencias, opiniones y ideas específicas de la industria que una IA no pudo generar.

Contrata superior

Si bien esta investigación se centra en distinguir diferentes modelos de IA, también demuestra cómo el texto generado por IA difiere de la escritura humana.

A medida que los motores de búsqueda mejoran su capacidad para detectar contenido de IA, la escritura de IA fuertemente plantada puede perder valor.

Al comprender cómo identificar el texto de la IA, puede crear contenido que se eleva por encima de la salida promedio de chatbot, atrayendo tanto a los lectores como a los motores de búsqueda.

Combinar la eficiencia de la IA con la creatividad y la experiencia humana es el mejor enfoque.

Imagen destacada: Pixel-shot/Shutterstock

Con información de Search Engine Journal.

Leer la nota Completa > Cómo detectar (y arreglar) contenido generado por IA

LEAVE A REPLY

Please enter your comment!
Please enter your name here