Estatística Básica até Bayes: um passo a passo realmente simples (com fórmulas em SVG)
Todas as expressões matemáticas abaixo são renderizadas como imagens SVG (via CodeCogs) para funcionar em qualquer WordPress sem plugins.
Passo 1 — População, amostra e variável
População: o conjunto completo que você quer entender (ex.: todos os usuários do site).
Amostra: um subconjunto observado da população (ex.: os 300 últimos acessos).
Variável: o que você mede (ex.: “clicou no botão?” sim/não; “tempo na página” em segundos).
Por que importa? Sem separar população de amostra, você generaliza demais e tira conclusões frágeis.
Microexercício: escolha um problema seu (ex.: taxa de clique). Defina população, amostra e variável.
Leituras: Estatística · População e amostra
Passo 2 — Medidas simples: média, mediana e proporção
Média: soma ÷ quantidade (boa quando não há muitos extremos).
Mediana: valor do meio (resiste a extremos).
Proporção: fração de “sucessos” (ex.: 18 cliques em 300 visitas → 18/300 = 6%).
Microexercício: calcule a proporção de sucesso de um exemplo seu.
Passo 3 — Variabilidade em uma frase
Desvio-padrão (ideia): mede o quanto os dados variam ao redor da média.
Intuição: a mesma média pode esconder comportamentos muito diferentes se a dispersão mudar.
Microexercício: pense em dois dias de tráfego com mesma média de visitas; anote por que “regularidade” (baixa variação) ajuda a prever melhor.
Leitura: Desvio padrão
Passo 4 — Probabilidade sem dor
Probabilidade = chance entre 0 e 1 (ou 0% e 100%).
- Regra da soma (eventos mutuamente exclusivos):
- Regra do produto (eventos independentes):
Microexercício: se 30% visitam a página A e 20% a B, e ninguém visita as duas, qual a chance de visitar A ou B?
Leitura: Probabilidade
Passo 5 — Probabilidade condicional (a peça-chave)
e
Atenção:
Microexercício: “P(tem doença | teste positivo)” não é igual a “P(teste positivo | tem doença)”. Explique em uma frase por quê.
Leitura: Probabilidade condicional
Passo 6 — Teorema de Bayes (versão de bolso)
Bayes reequilibra sua crença inicial (prior) com a evidência do dado (verossimilhança) e devolve uma crença atualizada (posterior).
Frase-resumo:
(normalizado para virar probabilidade).
- Prior
: sua crença antes do dado.
- Verossimilhança
: quão compatível é o dado com a hipótese.
- Posterior
: crença depois de ver o dado.
Microexercício: pense em por que um evento raro (prior baixo) continua improvável mesmo com um teste “bom”.
Leitura: Teorema de Bayes
Passo 7 — Um exemplo com números (super simples)
Cenário: doença rara (1%). Teste acerta 99% quando há doença (sensibilidade) e erra 5% em quem não tem (falso positivo).
Evidência (teste+ em geral):
Posterior (probabilidade de ter a doença após teste+):
Moral: como a doença é rara, ainda é improvável mesmo depois do teste positivo (efeito da base).
Passo 8 — Proporções com “pseudocontagem” (regra prática)
Para taxas/proporções (ex.: taxa de clique), um prior Beta(α, β) funciona como “pseudocontagens”.
- Comece simples com α=1, β=1 (prior uniforme: 0 a 100% igualmente plausível).
- Observou s sucessos e f fracassos? Então
.
- A média posterior vira
.
Exemplo: 18 cliques em 300 visitas, prior uniforme →
→ média ≈
(≈ 6,3%).
Leitura: Distribuição Beta
Passo 9 — O que reportar (sem fórmulas difíceis)
- Ponto: média (ou mediana) posterior.
- Incerteza: intervalo de credibilidade (ex.: 95%).
- Decisão: em A/B, pergunte “qual a probabilidade de A ser melhor que B?”.
Passo 10 — Armadilhas comuns
- Ignorar a base (prevalência) → superestima riscos após teste positivo.
- Prior exagerado → domina os dados. Prefira priors fracos quando não souber.
- Confundir
com
→ inversão do condicional.
- Esquecer a incerteza → sempre relate estimativa e incerteza.
Próximos passos
- Repetir o exemplo do teste com números seus.
- Repetir o exemplo de proporção (Beta-Binomial) com seus dados.
- Depois migrar para Python (PyMC/ArviZ) para intervalos de credibilidade e A/B Bayes.
Tabela resumo
| Passo | O que saber | Exemplo | Resultado prático |
|---|---|---|---|
| 1 | População × amostra | Todos usuários × últimos 300 | Evita generalizações erradas |
| 2 | Média, mediana, proporção | 18/300 = 6% | Medidas simples já ajudam |
| 3 | Variabilidade | Mesma média, variância diferente | Regularidade melhora previsão |
| 4 | Regras básicas |
|
Combina chances com segurança |
| 5 | Condicional |
|
Evita confusões críticas |
| 6 | Bayes (ideia) |
|
Atualiza crença com dado |
| 7 | Exemplo numérico | Doença rara + teste | Após positivo: ~16,6% |
| 8 | Proporção Bayes |
|
Regra prática com pseudocontagens |
| 9 | O que reportar | Média + intervalo | Estimativa com incerteza |
| 10 | Armadilhas | Base rate, prior forte, condicional | Diagnóstico e A/B mais seguros |
Referências rápidas
Estatística · Probabilidade · Probabilidade condicional · Teorema de Bayes · Distribuição Beta
