150 leituras

A falência da taxa de base: por que seu modelo mais inteligente ainda está errado

por f1r3_wh1sk3y3m2025/06/30
Read on Terminal Reader

Muito longo; Para ler

Os modelos de IA são tão precisos quanto o teste de validação diz?
featured image - A falência da taxa de base: por que seu modelo mais inteligente ainda está errado
f1r3_wh1sk3y HackerNoon profile picture

“O problema não é os dados, é como ignoramos as partes aborrecidas dele.”

Por que um modelo com 99% de precisão de previsão inundaria sua caixa de entrada com falsos alarmes e transformaria seu belo dia em um pesadelo de depuração?

confundido ?
Bem-vindo ao TheBase Rate FallacyUm preconceito que faz com que humanos e máquinas julguem erroneamente as probabilidades quando ignoramos o contexto em que os dados existem.


What Is the Base Rate Fallacy?

O que é a falência da taxa de base?

Vamos dar uma rápida olhada no que a falácia da taxa de base realmente é.

Obase rateé a probabilidade total de um evento ocorrer -AntesCom base em novas evidências, obase rate fallacyIsso acontece quando essas probabilidades subjacentes são ignoradas, e nós nos concentramos apenas nas novas evidências.


Let the Math Speak

Deixe a Matemática Falar

Imagine uma situação em que uma doença afeta1 in 1000Você, sendo um gênio, desenvolve um teste que é99% accurate:

  • Se alguém tem a doença, o teste é positivo 99% das vezes (verdadeiro positivo).
  • Se alguém não tem a doença, o teste é negativo 99% do tempo (verdadeiro negativo).

Agora, suponha que alguém testepositiveQual é a probabilidade de que eles realmente tenham a doença?

Ao contrário da intuição, énot 99%Aqui está porquê:

Para 1000 pessoas:

  • 1 pessoa realmente tem a doença → o teste provavelmente a pega → 1 verdadeiro positivo
  • 999 pessoas não têm a doença → 1% deles testar positivo → ~10 falsos positivos

Entre os que testam positivamente:

  • Total de positivos = 1 (verdadeiro) + 10 (falso) = 11
  • Probabilidade de realmente ter a doença = 1 / 11 ≈ 9%

Apesar de um teste que é “99% preciso”, sua chance de ficar doente é apenas9%Isso porque a doença é rara.

Esse1-in-1000É oTaxa de base- e ignorá-lo leva a uma má interpretação maciça.


Why Humans Fall for This

Por que os humanos caem por isso

Este não é apenas um problema de matemática – é umbrain problem.

Psychologists Daniel KahnemaneAmos TverskyDescobriu que quando avaliamos a probabilidade, subconscientemente substituímos perguntas difíceis por perguntas mais fáceis.

“Quão bem esta situação corresponde ao meu estereótipo mental?”

Então, quando um teste é 99% preciso, nosso cérebro diz:
“Sounds like a match!”
...e assumimos que o resultado deve ser verdadeiro.

Este atalho é chamado derepresentativeness heuristic, e nos faz ignorar a taxa de base estatística chata.


The Engineer–Lawyer Conundrum

O Engenheiro-Lawyer Conundrum

Este efeito foi demonstrado por meio daEngineer–Lawyer problem.

Os participantes foram informados:

  • Há 70 advogados e 30 engenheiros em uma sala.
  • Jack é introvertido, gosta de quebra-cabeças de matemática e gosta de eletrônicos.

Então perguntou: “Qual é a probabilidade de Jack ser um engenheiro?”

Embora a taxa de referência sugira a30% chanceA maioria das pessoas disse80–90%Porque o JackSonsA descrição parece representativa, então a relação 70/30 é ignorada – mesmo que seja um preditor mais poderoso.


How This Fails in the Real World

How This Fails in the Real World

** Previsões de IA \ Você cria um modelo que marca produtos defeituosos com 95% de precisão.0.1%de itens são realmente defeituosos, a maioria dos alertas serão falsos positivos. Operações podem ir para o modo de pânico - sobre nada.

**Planejamento da Cadeia de Suprimentos \ Um sistema de atraso de alerta precoce marca os riscos do fornecedor.1 in 500Quando os envios são realmente atrasados, a maioria dos avisos será falsa – mesmo que o sistema seja tecnicamente “exato”.

E isso acontece em uma ampla gama de domínios: detecção de fraudes, testes médicos, alertas de ameaças, monitoramento de anomalias – a lista continua.


The Solution: Bayes to the Rescue

A Solução: Bayes para o resgate

de forma matemática,Bayes’ TheoremAjuda a combater a falácia da taxa de base. Atualiza nossas crenças combinando as taxas de base com novas evidências:

P(A ÁthaB)=P(B)P(B ÁthaA) / P(A)

Onde é:

  • P(A) B: Probabilidade de ter a doença dado um teste positivo
  • P(B) A: Probabilidade de testar positivo se você tem a doença
  • P(A): Taxa de base (probabilidade prévia)
  • P(B): Probabilidade total de testes positivos (verdadeiros + falsos positivos)

O Teorema de Bayes nos obriga a equilibrarO que sabemoscomO que vemosAlgo que a intuição humana tende a saltar.


Final Thoughts

Pensamentos finais

Vivemos em um mundo impulsionado por previsões – da IA à saúde à logística.Mas os números, não importa o quão sofisticados, não significam nada sem o direito.context.

E às vezes, a visão mais poderosa reside na probabilidade chata e de baixa chave que fomos muito rápidos para ignorar.


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks