Medidas de Dispersão: Teoria e Exemplos Práticos
Introdução (Nível Básico)
Em estatística, as medidas de dispersão indicam o quanto os dados estão espalhados em torno de uma medida central (geralmente a média). Elas ajudam a entender a variabilidade dos dados e são fundamentais para uma análise completa de um conjunto de dados.
Principais Medidas de Dispersão
As principais medidas de dispersão são:
- Amplitude
- Variância
- Desvio Padrão
- Coeficiente de Variação
1. Amplitude
A amplitude é a diferença entre o valor máximo e o valor mínimo de um conjunto de dados. Ela oferece uma visão geral da variabilidade, mas não considera os valores intermediários.
Fórmula: Amplitude = Xmáx – Xmín
Exemplo na Indústria: Em uma linha de produção, os tempos medidos são 45, 47, 42, 46 e 43 segundos. A amplitude seria:
Amplitude = 47 – 42 = 5 segundos
2. Variância
A variância mede a dispersão dos dados em torno da média. Quanto maior a variância, maior a dispersão.
Fórmula:
σ2 = (1/n) * Σ (Xi – μ)2
onde μ é a média, n é o número de observações, e Xi é cada valor individual.
Exemplo na Indústria: Se os tempos de produção forem 45, 47, 42, 46 e 43 segundos, calculamos a variância com a média de 44,6 segundos.
3. Desvio Padrão
O desvio padrão é a raiz quadrada da variância e fornece uma medida de dispersão na mesma unidade dos dados originais.
Fórmula:
σ = √((1/n) * Σ (Xi – μ)2)
Exemplo na Indústria: Para os mesmos tempos de produção, o desvio padrão seria de 1,87 segundos.
4. Coeficiente de Variação
O coeficiente de variação é útil para comparar a dispersão entre dois conjuntos de dados com médias diferentes. Ele é o desvio padrão dividido pela média.
Fórmula: CV = (σ/μ) * 100
Exemplo na Indústria: Em duas linhas de produção com médias de 10 e 50 segundos e desvio padrão de 5 segundos, o coeficiente de variação nos mostra a dispersão relativa de cada linha.
Conclusão (Nível Avançado)
As medidas de dispersão são fundamentais para entender a variabilidade dos dados em diversas áreas, como na indústria e nos esportes. Elas permitem uma análise mais completa e detalhada de como os dados estão distribuídos.
Exemplos em Python
Podemos usar bibliotecas como o NumPy para calcular essas medidas em Python.
Exemplo 1: Cálculo da Variância e Desvio Padrão
import numpy as np
# Dados de exemplo
dados_producao = [45, 47, 42, 46, 43]
# Cálculo da média
media = np.mean(dados_producao)
# Variância
variancia = np.var(dados_producao)
print(f'Variância: {variancia:.2f}')
# Desvio Padrão
desvio_padrao = np.std(dados_producao)
print(f'Desvio Padrão: {desvio_padrao:.2f}')
Exemplo 2: Cálculo da Amplitude
# Amplitude
amplitude = max(dados_producao) - min(dados_producao)
print(f'Amplitude: {amplitude}')

Leave a comment