“El problema no es los datos, es cómo ignoramos las partes aburridas de ellos”.
¿Son los modelos de IA tan precisos como dice la prueba de validación? ¿Por qué un modelo con exactitud de predicción del 99% inundaría su buzón de entrada con falsas alarmas y convertiría su hermoso día en una pesadilla de debugging?
¿Confundido ?
Bienvenido a laBase Rate FallacyUn bias que hace que tanto humanos como máquinas juzguen mal las probabilidades cuando ignoramos el contexto en el que existen los datos.
What Is the Base Rate Fallacy?
¿Cuál es la tasa base de falsificación?Vamos a echar un vistazo a lo que realmente es la falla de la tasa de base.
Elbase ratees la probabilidad total de que un evento ocurra-Antes considering new evidence. The base rate fallacyocurre cuando estas probabilidades subyacentes son ignoradas, y nos enfocamos sólo en las nuevas pruebas.
Let the Math Speak
Deja que las matemáticas hablenImagínese una situación en la que una enfermedad1 in 1000Usted, siendo un genio, desarrolla una prueba que es99% accurate:
- Si alguien tiene la enfermedad, la prueba es positiva en el 99% de los casos (verdadero positivo).
- Si alguien no tiene la enfermedad, la prueba es negativa 99% del tiempo (verdadero negativo).
Ahora, supongamos que alguien pruebapositive¿Cuál es la probabilidad de que realmente tengan la enfermedad?
A diferencia de la intuición, esnot 99%Aquí está por qué:
De cada 1.000 personas:
- 1 persona realmente tiene la enfermedad → la prueba probablemente la atrapa → 1 verdadero positivo
- 999 personas no tienen la enfermedad → 1% de ellos prueba positivo → ~10 falsos positivos
Entre las pruebas positivas se encuentran:
- Total de positivos = 1 (verdadero) + 10 (falso) = 11
- Probabilidad de tener realmente la enfermedad = 1 / 11 ≈ 9%
A pesar de una prueba que es "99% exacta", tu probabilidad de estar enfermo es sólo9%Porque la enfermedad es muy rara.
que1-in-1000Es elTasa de base-y ignorarlo conduce a una masiva malinterpretación.
Why Humans Fall for This
¿Por qué los humanos caen por esto?The twist? This isn’t just a math problem—it’s a brain problem.
PsicólogosDaniel KahnemanyAmos TverskyDescubrieron que cuando evaluamos la probabilidad, subconscientemente reemplazamos las preguntas difíciles con las más fáciles.
“¿Qué tan bien coincide esta situación con mi estereotipo mental?”
Así que cuando una prueba es 99% exacta, nuestro cerebro dice:
“¡Suena como un partido!”
...y asumimos que el resultado debe ser verdadero.
Este corto se denominarepresentativeness heuristic, y nos hace ignorar la aburrida tasa de base estadística.
The Engineer–Lawyer Conundrum
El ingeniero-jurista ConundrumEste efecto se demostró a través de laEngineer–Lawyer problem.
Se les dijo a los participantes:
- Hay 70 abogados y 30 ingenieros en una habitación.
- Jack es introvertido, disfruta de puzzles de matemáticas y le gusta la electrónica.
Luego preguntó: “¿Cuál es la probabilidad de que Jack sea un ingeniero?”
A pesar de que el índice de referencia sugiere un30% chanceLa mayoría de la gente dijo80–90%Porque JackSonidoLa descripción se siente representativa, por lo que la relación 70/30 se ignora, aunque sea un predictor más poderoso.
How This Fails in the Real World
Cómo esto falla en el mundo real**Predicciones de IA: Creas un modelo que marca los productos defectuosos con una precisión del 95%.0.1%de los elementos son realmente defectuosos, la mayoría de las alertas serán falsos positivos.
**Planificación de la cadena de suministro \ Un sistema de retraso de advertencia temprana marca los riesgos del vendedor.1 in 500Si los envíos son realmente retrasados, la mayoría de las advertencias serán falsas, incluso si el sistema es técnicamente “preciso”.
Y ocurre en una amplia gama de dominios: detección de fraudes, pruebas médicas, alertas de amenazas, monitoreo de anomalías: la lista continúa.
The Solution: Bayes to the Rescue
La solución: Bayes al rescateEn matemáticas,Bayes’ TheoremAyuda a contrarrestar la falla de la tasa de base. actualiza nuestras creencias al combinar las tasas de base con nuevas pruebas:
P(B)=P(B)P(B)A / P(A)
Dónde es:
- P(A) B: Probabilidad de tener la enfermedad dada una prueba positiva
- P(B) A: Probabilidad de que el test sea positivo si tiene la enfermedad
- P(A): Base rate (prior probability)
- P(B): Probabilidad total de prueba positiva (verdadero + falsos positivos)
El teorema de Bayes nos obliga a equilibrarLo que sabemosconLo que vemosAlgo que la intuición humana tiende a saltar.
Final Thoughts
Pensamientos finalesVivimos en un mundo impulsado por las predicciones, desde la IA a la atención médica a la logística, pero los números, no importa cuán sofisticados, no significan nada sin lo correcto.context.
Y a veces, la visión más poderosa se encuentra en la aburrida probabilidad de baja clave que fuimos demasiado rápidos para ignorar.