Percentis: o que são e como são calculados?
Medidas de posição ou tendência não central ajudam a saber a posição de uma série de valores que não têm uma localização central dentro da distribuição. O objetivo dessas medições é dividir um conjunto de dados ou observações igualmente. Entre essas medidas podemos encontrar os quartis, os decis e os percentis ou centis. Neste artigo, vamos nos concentrar apenas nos percentis.
Em estatística, um percentil é entendido como a medida da posição não central que divide uma distribuição ordenada de dados em cem partes iguais. Nas palavras de Salazar e Del Castillo (2018) “são certos números que dividem a sequência de dados ordenados em cem partes iguais de percentagens”. Uma vez que estes foram organizados do menor para o maior, o percentil indicará o valor abaixo do qual uma certa porcentagem de observações pode ser encontrada. Vejamos alguns exemplos.
- Uma menina de 4 anos, 105 cm de altura, está no 80º percentil para meninas dessa idade. Isso significa que 80% das meninas dessa idade estão abaixo dessa altura. Da mesma forma, podemos afirmar que a altura dessa menina é superada por 20% das meninas da sua idade.
- Um estudante universitário obteve nota 9 na prova de Biologia e estava no percentil 90, o que significa que 90% dos alunos têm nota inferior a 9 e que 10% dos alunos estão acima. Os percentis indicam principalmente os percentuais que estão abaixo de um determinado valor, mas também nos informam daqueles que estão acima. Desta forma, o 3º percentil indica que ultrapassa 3% dos valores e é ultrapassado pelos restantes 97%. O 50º percentil é aquele valor da variável que ultrapassa 50% das observações e é ultrapassado pelos outros 50% das observações. O 99º percentil excede 99% dos dados e é excedido, por sua vez, pelo 1% restante.
Para que servem os percentis?
Os percentis são usados para localizar os dados em uma amostra. Eles permitem posicionar uma série de dados ordenados de forma que a porcentagem que está abaixo e acima de uma determinada posição possa ser determinada. Saber a localização de uma informação em relação a outras pode ser uma informação valiosa.
Assim, por exemplo, saber que 70% das observações estão localizadas abaixo do 70º percentil nos diz que a distribuição dos dados, na maioria das vezes, está abaixo desse percentil.
O percentil também permite que você manipule uma série de dados de maneira fácil e compreensível e atribua uma posição a eles. A nível prático, pode ajudar a verificar se o elemento em análise está dentro dos intervalos normais ou se está abaixo ou acima da média de uma variável.
Por exemplo, quando testes psicométricos ou baterias neuropsicológicas são aplicados, os percentis podem determinar se os resultados obtidos estão dentro ou fora da faixa de normalidade.
Como podemos calculá-los?
Para calcular um percentil, devemos levar em consideração os seguintes passos:
- Classifique os dados do menor para o maior.
- Calcule a posição do percentil aplicando a seguinte fórmula:
i = k (n + 1) / 100
Onde:
i = Posição dentro da amostra solicitada que representa o percentil.
K = número do percentil a ser encontrado.
n = tamanho da amostra.
Se i é um número inteiro, então Pk = Yi (valor de onde i está localizado).
Se i não é um número inteiro, então Pk = (1-d) Yi + (d) Yi + 1 (Yi + 1 representa o valor que está na posição ao lado de Yi).
d = valores decimais.
Vamos ver tudo em um exemplo: queremos saber o percentil 25 (P25) das idades para um grupo de funcionários e mulheres que fazem parte de uma indústria farmacêutica.
Funcionários | Idades | Tamanho da amostra |
Homens | 18, 19, 20, 22, 24, 26, 29, 31, 35, 45, 61 | 11 |
Mulheres | 19, 20, 21, 22, 23, 24, 25, 27, 28, 29, 30, 31, 32, 35 | 14 |
Para encontrar o 25º percentil do grupo de homens na empresa, substituímos os valores na fórmula:
i = k (n + 1) / 100
i = 25 (11 + 1) / 100 = 3
Por se tratar de um número inteiro, o valor da idade encontrado na posição 3 é tomado como o valor do percentil 25, neste caso a idade do grupo de homens que ocupa a posição 3 é de 20 anos. Isso significa que 25% da amostra masculina tem menos de 20 anos.
Para o grupo de mulheres da empresa também aplicamos o mesmo procedimento.
i = k (n + 1) / 100
i = 25 (14 + 1) / 100 = 3,75
No entanto, como ele tem decimais, não podemos assumir a posição 3,75, então devemos interpolar os resultados, tomando i = 3 e d = 0,75. A substituição dos dados na fórmula ficaria assim:
Pk = (1-d) Yi + (d) Yi + 1
P25 = (1-0,75) 21 + (0,75) 22
P25 = 21,75
Portanto, o 25º percentil para o grupo de mulheres é de 21,75 anos. Isso significa que 25% da amostra de mulheres tem idade inferior a 21,75 anos. Da mesma forma, podemos afirmar que 75% das mulheres estão acima de 21,75 anos.
Como qualquer medida de posição não central, os percentis nos permitem saber a localização de certos valores ao longo de um conjunto de dados ordenados e fornecem informações sobre a porcentagem de dados que podem ser encontrados abaixo de uma determinada posição, permitindo-nos inferir diretamente aqueles que estão acima dela.
Todas as fontes citadas foram minuciosamente revisadas por nossa equipe para garantir sua qualidade, confiabilidade, atualidade e validade. A bibliografia deste artigo foi considerada confiável e precisa academicamente ou cientificamente.
- Salazar, C. y Del Castillo, S. (2018). Fundamentos básicos de estadística (1ª ed.). Quito: Sin editorial