Hallucination (alucinación IA)

Qué es una hallucination

Hallucination (alucinación) es cuando un LLM genera información que parece convincente y verosímil pero es factualmente incorrecta o completamente inventada.

El término viene de la psicología: la IA “ve” información que no existe, igual que una persona alucina algo no real.

Ejemplos típicos

Datos numéricos inventados

“Según un estudio de Harvard de 2022, el 67% de las pymes españolas que invierten en SEO recuperan la inversión en 6 meses.”

(El estudio no existe. Harvard no ha publicado ese dato.)

Citas fabricadas

“Como dijo Steve Jobs: ‘La innovación es el único motor del crecimiento sostenible.’”

(Jobs nunca dijo eso. La IA fabricó la cita.)

URLs/referencias falsas

“Puedes leer más en https://google.com/research/seo-pymes-2024.pdf”

(URL inventada. Lleva a 404.)

Capacidades imaginarias

“Sí, puedo procesar PDFs adjuntos.” (cuando el modelo NO tiene esa capacidad)

Información histórica errónea

“Cervantes nació en 1547 en Alcalá de Henares y murió en 1616 en Madrid el 23 de abril, el mismo día que Shakespeare.”

(Mezcla datos reales con coincidencias inventadas. En realidad, Cervantes murió el 22 de abril, no el 23, aunque se conmemora el 23.)

Por qué pasan

Los LLMs predicen la siguiente palabra más probable dado el contexto. No tienen un mecanismo de verificación de verdad.

Si le preguntas un dato que no recuerda, el modelo NO dice “no sé”. Genera lo que suena probable según patrones que aprendió. Eso puede ser correcto o totalmente falso.

Tipos de hallucinations

Closed-domain

El modelo inventa info DENTRO del dominio que conoce.

Ejemplo: pides resumir un texto que le diste. El resumen menciona detalles que no aparecen en el texto original.

Open-domain

El modelo inventa info sobre el mundo en general.

Ejemplo: preguntas por una persona real y el modelo se inventa hechos de su biografía.

Reasoning errors

El modelo razona mal sobre algo correcto.

Ejemplo: “Si A > B y B > C, entonces C > A” (falso pero lo dice con confianza).

Por qué son peligrosas para empresa

1. Pérdida de credibilidad

Tu chatbot da info falsa a un cliente. Tu empresa pierde confianza.

2. Problemas legales

Tu IA recomienda algo médica/jurídica/fiscalmente incorrecto. Cliente actúa según eso. Daño real.

3. Decisiones malas

Empleado pregunta a IA sobre normativa, IA inventa, empleado decide en base a eso.

4. Datos numéricos falsos en presentaciones

Tu equipo usa stats inventadas en una propuesta a cliente. Cliente verifica, no encuentra fuente, descubre invención.

Cómo reducir hallucinations

1. RAG (Retrieval-Augmented Generation)

La defensa más efectiva. El LLM solo responde basándose en tus documentos reales, no en lo que cree saber:

Pregunta del usuario
Sistema busca en TUS documentos
Pasa los documentos al LLM como contexto
LLM responde con info verificada de esos documentos
Si no hay info → responde “no encontrado en la base de conocimiento”

Reduce hallucinations al 5-10% típicamente vs 30-50% sin RAG.

2. Temperature baja

LLMs tienen un parámetro temperature (0-2):

0: respuestas más deterministas, conservadoras
1: balance
2: respuestas creativas, riesgo de alucinación

Para casos de uso factual: temperature 0-0.3.

3. System prompts estrictos

Instrucciones claras:

Eres un asistente que solo responde con información presente en los documentos del contexto.
Si no encuentras la respuesta en el contexto, di explícitamente: "No tengo esa información en mi base de conocimiento."
NO inventes datos. NO uses información de tu entrenamiento general. NO cites fuentes externas a los documentos proporcionados.

4. Validación de outputs

Para datos críticos (precios, fechas, nombres):

Validar contra base de datos
Pasar por segundo modelo verificador
Human-in-the-loop para casos críticos

5. Citar fuentes

Pedir al modelo que cite el documento/sección de donde sacó cada afirmación:

“Según el manual de procedimientos (sección 3.2), el plazo de devolución es de 30 días.”

El usuario puede verificar.

Mitos vs realidad

”GPT-5 ya no alucina”

Falso. Los modelos más nuevos alucinan menos pero siguen haciéndolo. Especialmente en queries específicas o nichos.

”Pidiendo amablemente al modelo que no alucine, no alucinará”

Falso. El modelo no controla conscientemente cuándo está alucinando.

”Si el modelo está seguro, es correcto”

Falso. Los modelos a menudo están seguros de cosas inventadas. La confianza no correlaciona con corrección.

Tasa de hallucination

Estimaciones públicas:

GPT-4 sin RAG: 15-40% en tareas factuales
GPT-4 + RAG bien hecho: 3-10%
Modelos especializados con verificación: <2%

Para casos críticos: combinar RAG + validación humana + auditoría continua.

En IMPERO

Las IAs que configuramos para clientes usan RAG estricto + temperature baja + system prompts explícitos que prohíben inventar datos. Cuando la IA no encuentra info en los documentos del cliente, dice claramente “no tengo esa información” en lugar de adivinar.

Sin esto, no se puede poner IA en producción para servicio a cliente seriamente.

Lee IA para PYMES en España: por qué ChatGPT no basta.

Qué es una hallucination

Ejemplos típicos

Datos numéricos inventados

Citas fabricadas

URLs/referencias falsas

Capacidades imaginarias

Información histórica errónea

Por qué pasan

Tipos de hallucinations

Closed-domain

Open-domain

Reasoning errors

Por qué son peligrosas para empresa

1. Pérdida de credibilidad

2. Problemas legales

3. Decisiones malas

4. Datos numéricos falsos en presentaciones

Cómo reducir hallucinations

1. RAG (Retrieval-Augmented Generation)

2. Temperature baja

3. System prompts estrictos

4. Validación de outputs

5. Citar fuentes

Mitos vs realidad

”GPT-5 ya no alucina”

”Pidiendo amablemente al modelo que no alucine, no alucinará”

”Si el modelo está seguro, es correcto”

Tasa de hallucination

En IMPERO

LLM (LLM)

RAG (RAG)

AUDITORÍA GRATUITA
SIN COMPROMISO.

Hallucination (alucinación IA)

Qué es una hallucination

Ejemplos típicos

Datos numéricos inventados

Citas fabricadas

URLs/referencias falsas

Capacidades imaginarias

Información histórica errónea

Por qué pasan

Tipos de hallucinations

Closed-domain

Open-domain

Reasoning errors

Por qué son peligrosas para empresa

1. Pérdida de credibilidad

2. Problemas legales

3. Decisiones malas

4. Datos numéricos falsos en presentaciones

Cómo reducir hallucinations

1. RAG (Retrieval-Augmented Generation)

2. Temperature baja

3. System prompts estrictos

4. Validación de outputs

5. Citar fuentes

Mitos vs realidad

”GPT-5 ya no alucina”

”Pidiendo amablemente al modelo que no alucine, no alucinará”

”Si el modelo está seguro, es correcto”

Tasa de hallucination

En IMPERO

LLM (LLM)

RAG (RAG)

AUDITORÍA GRATUITASIN COMPROMISO.

AUDITORÍA GRATUITA
SIN COMPROMISO.