Estatística Básica até Bayes: um passo a passo realmente simples (com fórmulas em SVG)

Todas as expressões matemáticas abaixo são renderizadas como imagens SVG (via CodeCogs) para funcionar em qualquer WordPress sem plugins.

Passo 1 — População, amostra e variável

População: o conjunto completo que você quer entender (ex.: todos os usuários do site).
Amostra: um subconjunto observado da população (ex.: os 300 últimos acessos).
Variável: o que você mede (ex.: “clicou no botão?” sim/não; “tempo na página” em segundos).

Por que importa? Sem separar população de amostra, você generaliza demais e tira conclusões frágeis.

Microexercício: escolha um problema seu (ex.: taxa de clique). Defina população, amostra e variável.

Leituras: Estatística · População e amostra

Passo 2 — Medidas simples: média, mediana e proporção

Média: soma ÷ quantidade (boa quando não há muitos extremos).
Mediana: valor do meio (resiste a extremos).
Proporção: fração de “sucessos” (ex.: 18 cliques em 300 visitas → 18/300 = 6%).

Microexercício: calcule a proporção de sucesso de um exemplo seu.

Leituras: Média · Mediana

Passo 3 — Variabilidade em uma frase

Desvio-padrão (ideia): mede o quanto os dados variam ao redor da média.

Intuição: a mesma média pode esconder comportamentos muito diferentes se a dispersão mudar.

Microexercício: pense em dois dias de tráfego com mesma média de visitas; anote por que “regularidade” (baixa variação) ajuda a prever melhor.

Leitura: Desvio padrão

Passo 4 — Probabilidade sem dor

Probabilidade = chance entre 0 e 1 (ou 0% e 100%).

  • Regra da soma (eventos mutuamente exclusivos): Regra da soma
  • Regra do produto (eventos independentes): Regra do produto

Microexercício: se 30% visitam a página A e 20% a B, e ninguém visita as duas, qual a chance de visitar A ou B?

Leitura: Probabilidade

Passo 5 — Probabilidade condicional (a peça-chave)

Probabilidade condicional   e   Probabilidade condicional invertida

Atenção: Não confundir condicionais

Microexercício: “P(tem doença | teste positivo)” não é igual a “P(teste positivo | tem doença)”. Explique em uma frase por quê.

Leitura: Probabilidade condicional

Passo 6 — Teorema de Bayes (versão de bolso)

Bayes reequilibra sua crença inicial (prior) com a evidência do dado (verossimilhança) e devolve uma crença atualizada (posterior).

Teorema de Bayes

Frase-resumo: Forma proporcional de Bayes  (normalizado para virar probabilidade).

  • Prior Prior: sua crença antes do dado.
  • Verossimilhança Likelihood: quão compatível é o dado com a hipótese.
  • Posterior Posterior: crença depois de ver o dado.

Microexercício: pense em por que um evento raro (prior baixo) continua improvável mesmo com um teste “bom”.

Leitura: Teorema de Bayes

Passo 7 — Um exemplo com números (super simples)

Cenário: doença rara (1%). Teste acerta 99% quando há doença (sensibilidade) e erra 5% em quem não tem (falso positivo).

  • P(doença)
  • P(teste+ | doença)
  • P(teste+ | não doença)

Evidência (teste+ em geral):

Evidência

Posterior (probabilidade de ter a doença após teste+):

Posterior

Moral: como a doença é rara, ainda é improvável mesmo depois do teste positivo (efeito da base).

Passo 8 — Proporções com “pseudocontagem” (regra prática)

Para taxas/proporções (ex.: taxa de clique), um prior Beta(α, β) funciona como “pseudocontagens”.

  • Comece simples com α=1, β=1 (prior uniforme: 0 a 100% igualmente plausível).
  • Observou s sucessos e f fracassos? Então Posterior Beta.
  • A média posterior vira Média posterior.

Exemplo: 18 cliques em 300 visitas, prior uniforme → Exemplo Beta → média ≈ 19/302 (≈ 6,3%).

Leitura: Distribuição Beta

Passo 9 — O que reportar (sem fórmulas difíceis)

  • Ponto: média (ou mediana) posterior.
  • Incerteza: intervalo de credibilidade (ex.: 95%).
  • Decisão: em A/B, pergunte “qual a probabilidade de A ser melhor que B?”.

Passo 10 — Armadilhas comuns

  • Ignorar a base (prevalência) → superestima riscos após teste positivo.
  • Prior exagerado → domina os dados. Prefira priors fracos quando não souber.
  • Confundir P(A|B) com P(B|A) → inversão do condicional.
  • Esquecer a incerteza → sempre relate estimativa e incerteza.

Próximos passos

  1. Repetir o exemplo do teste com números seus.
  2. Repetir o exemplo de proporção (Beta-Binomial) com seus dados.
  3. Depois migrar para Python (PyMC/ArviZ) para intervalos de credibilidade e A/B Bayes.

Tabela resumo

Passo O que saber Exemplo Resultado prático
1 População × amostra Todos usuários × últimos 300 Evita generalizações erradas
2 Média, mediana, proporção 18/300 = 6% Medidas simples já ajudam
3 Variabilidade Mesma média, variância diferente Regularidade melhora previsão
4 Regras básicas Soma  |  Produto Combina chances com segurança
5 Condicional Condicional Evita confusões críticas
6 Bayes (ideia) Bayes proporcional Atualiza crença com dado
7 Exemplo numérico Doença rara + teste Após positivo: ~16,6%
8 Proporção Bayes Posterior Beta simples Regra prática com pseudocontagens
9 O que reportar Média + intervalo Estimativa com incerteza
10 Armadilhas Base rate, prior forte, condicional Diagnóstico e A/B mais seguros

Referências rápidas

Estatística · Probabilidade · Probabilidade condicional · Teorema de Bayes · Distribuição Beta

Edvaldo Guimrães Filho Avatar

Published by