Cuando la IA se prefiere a sí misma: lo que el sesgo en contratación automatizada enseña a cualquier negocio que automatiza

Hay un paper que lleva semanas circulando entre la gente que se toma en serio la IA aplicada al negocio. Se llama AI Self-preferencing in Algorithmic Hiring y, aunque suena académico, plantea un problema que cualquier dueño de negocio debería entender antes de automatizar nada que tenga que ver con decisiones sobre personas, proveedores o clientes.

La idea, en una frase: los modelos de IA prefieren contenido generado por modelos de IA. Y cuando los pones a tomar decisiones, esa preferencia tiene consecuencias medibles.

Qué encontró el estudio (y por qué importa)

Los investigadores Jiannan Xu, Gujie Li y Jane Yi Jiang plantearon una pregunta sencilla: a medida que los LLM se involucran en ambos lados de los procesos de decisión —desde contratación hasta moderación de contenido— ¿favorecen sistemáticamente el contenido que se parece a sus propias salidas?

El experimento es elegante. Tomaron 2.245 currículums escritos por humanos, sacados de una plataforma profesional antes de la adopción masiva de la IA generativa. Para cada uno, generaron versiones contrafactuales con varios modelos punteros: GPT-4o, GPT-4o-mini, GPT-4-turbo, LLaMA 3.3-70B, Mistral-7B, Qwen 2.5-72B y Deepseek-V3.

Luego pusieron a esos mismos modelos a evaluar los currículums. ¿El resultado?

Los LLM prefieren consistentemente los currículums generados por ellos mismos sobre los escritos por humanos.

No es una pequeña inclinación estadística. Al simular pipelines de contratación realistas, los candidatos que usaban el mismo LLM que el evaluador tenían hasta un 60% más de probabilidades de pasar el filtro que candidatos igualmente cualificados con currículums escritos por humanos, con las mayores desventajas en campos como ventas y contabilidad.

Traducido: si la empresa usa GPT-4o para filtrar CVs y tú usaste GPT-4o para escribir el tuyo, juegas con ventaja. Si lo escribiste tú mismo, juegas en desventaja. Independientemente de lo cualificado que estés.

Por qué pasa esto

Los LLM no son evaluadores neutrales. Aprendieron qué "se ve bien" a partir de patrones en sus datos de entrenamiento, y al generar texto refuerzan esos mismos patrones. Cuando luego evalúan, premian lo que encaja con su propia estética: estructura, vocabulario, ritmo, formato.

El riesgo es que la IA magnifique el sesgo si favorece sistemáticamente currículums que reflejan su propio estilo generativo. En esos casos, la evaluación depende menos de la calidad real de las credenciales y más del alineamiento estilístico superficial con el LLM evaluador, dando ventajas injustificadas a quienes usan el mismo modelo para redactar.

Esto no es un bug. Es cómo funcionan estos modelos por diseño.

Esto no va solo de contratación

Aquí está la parte que pocos están conectando: el mismo problema aparece en cualquier sitio donde un LLM evalúa contenido que probablemente fue generado por otro LLM.

Piensa en los procesos que ya estás automatizando o pensando automatizar:

Proceso	Quién genera	Quién evalúa	Riesgo
Filtrado de CVs	Candidato (con IA)	Tu bot (IA)	Sesgo a favor del mismo modelo
Calificación de leads	Lead (a veces con IA)	Tu CRM con IA	Leads "pulidos" por IA puntúan más alto
Revisión de propuestas de proveedores	Proveedor (con IA)	Tu IA evaluadora	Lo mismo
Moderación de reseñas	Cliente (a veces con IA)	Tu sistema	Reseñas auténticas filtradas como sospechosas
Triage de emails	Remitente (con IA)	Tu bandeja en piloto automático	Emails "plantilla IA" priorizados sobre escritos a mano

El patrón se repite. Los hallazgos apuntan a un riesgo emergente y previamente ignorado en la toma de decisiones asistida por IA, y exigen marcos ampliados de equidad que aborden los sesgos derivados de interacciones IA-IA.

La buena noticia: se puede mitigar

No todo son malas noticias. El estudio demuestra que, en muchos casos, este sesgo puede reducirse en más del 50% mediante intervenciones simples que apuntan a las capacidades de auto-reconocimiento de los LLM.

Es decir: con un diseño adecuado del sistema, el problema se reduce drásticamente. La clave está en cómo construyes la automatización, no en si usas IA o no.

Qué deberías hacer si automatizas con IA

Si estás automatizando procesos de decisión —contratación, leads, proveedores, soporte priorizado, lo que sea— estos son los principios que deberías exigir a quien construya el sistema (o a ti mismo si lo construyes):

1. No dejes que un solo modelo sea generador y juez. Si usas el mismo LLM para redactar y evaluar, estás maximizando el sesgo. Combina modelos distintos en pasos diferentes del pipeline.

2. Mantén siempre la decisión final en humanos para casos sensibles. La IA puede filtrar, ordenar, resumir y proponer. Pero contratar a alguien, rechazar a un proveedor o priorizar un cliente VIP debería pasar por una persona. La automatización ahorra tiempo en lo repetitivo, no en lo crítico.

3. Evalúa con criterios estructurados, no con "impresión general". En lugar de pedirle a la IA "¿es buen candidato?", pídele que extraiga datos concretos (años de experiencia, tecnologías, certificaciones) y deja la valoración a reglas explícitas. Reduce la superficie donde el sesgo estilístico opera.

4. Audita los resultados periódicamente. Coge una muestra de las decisiones automatizadas cada mes y revísalas a mano. Si encuentras patrones raros ("todos los aprobados suenan igual"), tienes un problema.

5. Diversifica las fuentes de señal. No bases una decisión solo en lo que la IA "lee" de un documento. Cruza con datos externos: LinkedIn, CRM, histórico, comportamiento real. Cuanta más señal no textual, menos peso tiene el estilo.

6. Documenta cómo funciona tu automatización. Si no puedes explicar a un empleado o a un cliente cómo se toma una decisión, tienes un problema legal y reputacional esperando a estallar.

La parte incómoda para muchos vendedores de IA

La industria está llena de empresas vendiendo "IA para contratar", "IA para calificar leads", "IA para todo" como si fuera magia plug-and-play. Este paper es un recordatorio incómodo: una automatización mal diseñada no es neutral, es activamente sesgada, y muchas veces el sesgo es invisible hasta que alguien lo mide.

No es razón para no automatizar. Es razón para automatizar bien.

Cómo lo abordamos en Studio SmartWork

Cuando construimos automatizaciones con IA para nuestros clientes —ya sea calificación de leads, filtrado de emails o bots que responden preguntas— diseñamos los sistemas pensando exactamente en este tipo de problemas:

Separación de roles: el modelo que extrae información no es el mismo que el que decide.
Reglas explícitas sobre criterios subjetivos: la IA aporta datos, las reglas del negocio aportan decisiones.
Humano en el bucle donde toca: las automatizaciones operan 24/7, pero las decisiones sensibles siempre tienen un punto de revisión.
Transparencia total: el cliente ve qué hace cada paso, qué modelo lo hace y por qué.
Open-source con n8n: porque cuando tienes acceso al pipeline completo, puedes auditarlo. Las cajas negras de proveedores cerrados son justo lo contrario de lo que necesitas para detectar sesgos.

No es magia. Es ingeniería con criterio.

La conclusión que importa

La IA es una herramienta extraordinaria para eliminar trabajo repetitivo. Pero cuando la pones a tomar decisiones, deja de ser una herramienta y empieza a ser un actor más en tu proceso, con sus propios sesgos y preferencias. Este paper lo demuestra con datos: los LLM no son neutrales, prefieren a los suyos.

La pregunta que cada dueño de negocio debería hacerse antes de automatizar un proceso de decisión no es "¿funciona la IA?". Es: "¿he diseñado el sistema para que funcione bien, o he delegado mi criterio a una caja negra que se prefiere a sí misma?"

Las dos respuestas dan resultados muy distintos seis meses después.