As medidas de dispersão em estatística

· maio 8, 2019
As medidas de dispersão são importantes porque falam sobre a variabilidade que encontramos em uma determinada amostra ou população. Quando falamos de amostra, essa dispersão é importante porque condiciona o erro que vamos encontrar na hora de fazer inferências para medidas de tendência central, como a média.

Em uma distribuição de dados, as medidas de dispersão têm um papel muito importante. Essas medidas complementam as medidas de posição central, caracterizando a variabilidade dos dados.

Assim, as medidas de tendência central indicam valores relativos aos quais os dados parecem se agrupar. São recomendadas para inferir o comportamento de variáveis em populações e amostras. Alguns exemplos delas são a média aritmética, a moda ou a mediana (1).

As medidas de dispersão complementam essas medidas de tendência central. Além disso, são essenciais em uma distribuição de dados. Isso porque caracterizam a variabilidade dos dados. Sua relevância na formação estatística foi suscitada por Wild e Pfannkuch (1999).

Nessas medidas, a percepção da variabilidade dos dados é um dos componentes básicos no pensamento estatístico. A percepção dessa variabilidade nos fornece informações sobre a dispersão dos dados em relação a uma média.

A média aritmética é muito utilizada na prática, mas muitas vezes pode ser mal interpretada. Isso vai acontecer quando os valores da variável estiverem muito dispersos. É nessas ocasiões que é preciso acompanhar a média das medidas de dispersão (2).

Nas medidas de dispersão, há três componentes importantes relacionados com a variabilidade aleatória (2):

  • A percepção de sua ubiquidade no mundo que nos rodeia.
  • A competência para sua explicação.
  • A habilidade de quantificá-la (que implica compreender e saber aplicar o conceito de dispersão).
Homem transformando suas ideias em realidade

Para que servem as medidas de dispersão?

Em um estudo estatístico, na hora de generalizar os dados de uma amostra de uma população, as medidas de dispersão são muito importantes, já que condicionam de maneira direta o erro com o qual trabalhamos. Assim, quanto mais dispersões recolhermos em uma amostra, maior volume precisaremos para trabalhar com o mesmo erro.

Por outro lado, essas medidas nos ajudam a determinar se nossos dados se afastam muito do valor central. Com isso, nos proporcionam informação sobre se esse valor central é adequado para representar a população do estudo.

Essas medidas são muito úteis para comparar distribuições e compreender os riscos na tomada de decisões (1). Quanto maior a dispersão, menos representativo é o valor central. Estas são as mais utilizadas:

  • Amplitude.
  • Desvio médio.
  • Variância.
  • Desvio padrão.
  • Coeficiente de variação.

Funções de cada uma das medidas de dispersão em estatística

Amplitude

Em primeiro lugar, a amplitude é recomendada para uma comparação primária. Dessa maneira, considera somente as duas observações extremas. Por isso, é recomendada somente para amostragens pequenas (1). É definida como a diferença entre o último valor da variável e o primeiro (3).

Maçãs inteiras e cortadas

Desvio médio

Por sua vez, o desvio médio indica onde estariam concentrados os dados se todos estivessem à mesma distância da média aritmética (1). Consideramos o desvio de um valor da variável como a diferença em valor absoluto entre esse valor da variável e a média aritmética da série. Assim, é considerado a média aritmética dos desvios (3).

Variância

A variância é uma função algébrica de todos os valores, apropriada para tarefas de estatística inferencial (1). Pode ser definida como os desvios ao quadrado.

Desvio padrão

Para amostragens extraídas da mesma população, o desvio padrão é o mais utilizado (1). Trata-se da raiz quadrada da variância (3).

Coeficiente de variação

Trata-se de uma medida utilizada principalmente para comparar a variância entre dois conjuntos de dados medidos em diferentes unidades. Por exemplo, estatura e peso corporal dos alunos de uma amostra. Assim, é utilizado para determinar em qual distribuição estão mais agrupados os dados e a média é mais representativa (1).

Medidas de dispersão em estatística

O coeficiente de variação é uma medida de dispersão mais representativa que as anteriores porque é um número abstrato. Ou seja, é independente das unidades em que figuram os valores da variável. Em geral, esse coeficiente de variação costuma ser expresso em porcentagem (3).

Dessa forma, essas medidas de dispersão vão indicar, por um lado, o grau de variabilidade que há na amostra. Por outro, vão indicar a representatividade do valor central, já que se for obtido um valor pequeno, significará que os valores se concentram em torno desse centro.

Isso vai significar que há pouca variabilidade nos dados e o centro representa todos adequadamente. Em contrapartida, se o valor obtido for grande, significará que os valores não estão concentrados, e sim dispersos. Isso significará que há muita variabilidade e o centro não será muito representativo. Por outro lado, na hora de fazer inferências, vamos precisar de um tamanho de amostra maior se quisermos reduzir o erro, aumentado exatamente devido ao aumento da variabilidade.

  1. Graus, M. E. G. (2018). Estadística aplicada a la investigación educativa. Dilemas Contemporáneos: Educación, Política y Valores, 5(2).
  2. Batanero, C., González-Ruiz, I., del Mar López-Martín, M., & Miguel, J. (2015). La dispersión como elemento estructurador del currículo de estadística y probabilidad. Epsilon, 32(2), 7-20.
  3. Folgueras Russell, P. Medidas de Dispersión. Retrieved from https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=2ahUKEwixgPLvw_XgAhVDAmMBHW02AesQFjABegQIBRAC&url=http%3A%2F%2Fwww.educaguia.com%2FBiblioteca%2Fapuntesde%2Fmatematicas%2FESTADISTICAYPROBABILIDAD%2FMEDIDASDEDISPERSION.pdf&usg=AOvVaw0DCZ9Ej1YvX7WNEu16m2oF
  4. Wild, C. J. y Pfannkuch, M. (1999). Statistical thinking in empirical enquiry. International
    Statistical Review, 67(3), 223-263.