Qué es una hallucination
Hallucination (alucinación) es cuando un LLM genera información que parece convincente y verosímil pero es factualmente incorrecta o completamente inventada.
El término viene de la psicología: la IA “ve” información que no existe, igual que una persona alucina algo no real.
Ejemplos típicos
Datos numéricos inventados
“Según un estudio de Harvard de 2022, el 67% de las pymes españolas que invierten en SEO recuperan la inversión en 6 meses.”
(El estudio no existe. Harvard no ha publicado ese dato.)
Citas fabricadas
“Como dijo Steve Jobs: ‘La innovación es el único motor del crecimiento sostenible.’”
(Jobs nunca dijo eso. La IA fabricó la cita.)
URLs/referencias falsas
“Puedes leer más en https://google.com/research/seo-pymes-2024.pdf”
(URL inventada. Lleva a 404.)
Capacidades imaginarias
“Sí, puedo procesar PDFs adjuntos.” (cuando el modelo NO tiene esa capacidad)
Información histórica errónea
“Cervantes nació en 1547 en Alcalá de Henares y murió en 1616 en Madrid el 23 de abril, el mismo día que Shakespeare.”
(Mezcla datos reales con coincidencias inventadas. En realidad, Cervantes murió el 22 de abril, no el 23, aunque se conmemora el 23.)
Por qué pasan
Los LLMs predicen la siguiente palabra más probable dado el contexto. No tienen un mecanismo de verificación de verdad.
Si le preguntas un dato que no recuerda, el modelo NO dice “no sé”. Genera lo que suena probable según patrones que aprendió. Eso puede ser correcto o totalmente falso.
Tipos de hallucinations
Closed-domain
El modelo inventa info DENTRO del dominio que conoce.
Ejemplo: pides resumir un texto que le diste. El resumen menciona detalles que no aparecen en el texto original.
Open-domain
El modelo inventa info sobre el mundo en general.
Ejemplo: preguntas por una persona real y el modelo se inventa hechos de su biografía.
Reasoning errors
El modelo razona mal sobre algo correcto.
Ejemplo: “Si A > B y B > C, entonces C > A” (falso pero lo dice con confianza).
Por qué son peligrosas para empresa
1. Pérdida de credibilidad
Tu chatbot da info falsa a un cliente. Tu empresa pierde confianza.
2. Problemas legales
Tu IA recomienda algo médica/jurídica/fiscalmente incorrecto. Cliente actúa según eso. Daño real.
3. Decisiones malas
Empleado pregunta a IA sobre normativa, IA inventa, empleado decide en base a eso.
4. Datos numéricos falsos en presentaciones
Tu equipo usa stats inventadas en una propuesta a cliente. Cliente verifica, no encuentra fuente, descubre invención.
Cómo reducir hallucinations
1. RAG (Retrieval-Augmented Generation)
La defensa más efectiva. El LLM solo responde basándose en tus documentos reales, no en lo que cree saber:
- Pregunta del usuario
- Sistema busca en TUS documentos
- Pasa los documentos al LLM como contexto
- LLM responde con info verificada de esos documentos
- Si no hay info → responde “no encontrado en la base de conocimiento”
Reduce hallucinations al 5-10% típicamente vs 30-50% sin RAG.
2. Temperature baja
LLMs tienen un parámetro temperature (0-2):
- 0: respuestas más deterministas, conservadoras
- 1: balance
- 2: respuestas creativas, riesgo de alucinación
Para casos de uso factual: temperature 0-0.3.
3. System prompts estrictos
Instrucciones claras:
Eres un asistente que solo responde con información presente en los documentos del contexto.
Si no encuentras la respuesta en el contexto, di explícitamente: "No tengo esa información en mi base de conocimiento."
NO inventes datos. NO uses información de tu entrenamiento general. NO cites fuentes externas a los documentos proporcionados.
4. Validación de outputs
Para datos críticos (precios, fechas, nombres):
- Validar contra base de datos
- Pasar por segundo modelo verificador
- Human-in-the-loop para casos críticos
5. Citar fuentes
Pedir al modelo que cite el documento/sección de donde sacó cada afirmación:
“Según el manual de procedimientos (sección 3.2), el plazo de devolución es de 30 días.”
El usuario puede verificar.
Mitos vs realidad
”GPT-5 ya no alucina”
Falso. Los modelos más nuevos alucinan menos pero siguen haciéndolo. Especialmente en queries específicas o nichos.
”Pidiendo amablemente al modelo que no alucine, no alucinará”
Falso. El modelo no controla conscientemente cuándo está alucinando.
”Si el modelo está seguro, es correcto”
Falso. Los modelos a menudo están seguros de cosas inventadas. La confianza no correlaciona con corrección.
Tasa de hallucination
Estimaciones públicas:
- GPT-4 sin RAG: 15-40% en tareas factuales
- GPT-4 + RAG bien hecho: 3-10%
- Modelos especializados con verificación: <2%
Para casos críticos: combinar RAG + validación humana + auditoría continua.
En IMPERO
Las IAs que configuramos para clientes usan RAG estricto + temperature baja + system prompts explícitos que prohíben inventar datos. Cuando la IA no encuentra info en los documentos del cliente, dice claramente “no tengo esa información” en lugar de adivinar.
Sin esto, no se puede poner IA en producción para servicio a cliente seriamente.