Representação de uma amostra
Considere os seguintes dados, que expressam a produção diária de leite, em kg/dia, de um plantel de vacas da raça holandesa, anotados na ordem em que foram coletados.
23,5 |
24,7 |
18,9 |
24,6 |
18,9 |
17,0 |
18,9 |
20,9 |
23,5 |
25,5 |
20,9 |
20,9 |
18,9 |
18,5 |
18,2 |
18,0 |
18,5 |
17,5 |
18,2 |
17,5 |
Quando os dados estão listados sem nenhum outro tipo de ordenação do que a própria sequência em que foram coletados, denominamos de dados brutos. Assim, se observarmos os dados acima, vamos verificar que não é tão facilmente identificado o menor ou o maior valor encontrado nas medições, ou se os dados estão concentrados ao redor de um valor definido ou se são bem espalhados, dispersos.
Por outro lado, se organizarmos os dados em ordem crescente ou decrescente ficará mais fácil de ter uma ideia a respeito da distribuição dos valores. Esta organização dos dados em ordem crescente ou decrescente é o que denominamos rol. A seguir, os dados são apresentados de forma ordenada crescente.
17,0 |
17,5 |
17,5 |
18,0 |
18,2 |
18,2 |
18,5 |
18,5 |
18,9 |
18,9 |
18,9 |
18,9 |
20,9 |
20,9 |
20,9 |
23,5 |
23,5 |
24,6 |
24,7 |
25,5 |
Com os dados ordenados (rol)podemos agora verificar facilmente que o menor rendimento foi de 17,0 kg/dia e que o maior foi de 25,5 kg/dia, já delimitando a amplitude total dos dados.
Amplitude total dos dados, ou range, é a diferença entre o maior e o menor valor medido da variável em estudo.
No exemplo apresentado, a amplitude total é 8,5 (25,5 – 17,0 = 8,5).
Para descrever dados estatísticos resultantes de variáveis qualitativas ou quantitativas, utilizamos as distribuições de frequência. Para as variáveis qualitativas poderemos estabelecer apenas medidas de frequência de ocorrência, enquanto para as variáveis qualitativas poderemos utilizar diversas medidas estatísticas de posição e de dispersão, como veremos nas aulas seguintes.