Distribuição de Frequência
Uma distribuição de frequência é uma série estatística na qual os dados estão organizados em grupos de classes ou categorias estabelecidas convenientemente.
As distribuições de frequência podem ser divididas em dois tipos:
Para o exemplo apresentado, valores diários de produção de leite de vinte vacas holandesas, a distribuição de frequência sem intervalos de classes, ou pontual, é:
Tabela 1 – Distribuição de frequência pontual para a produção de leite.
ProduÇÃo de leite (kg.dia-¹) |
FrequÊncia absoluta (fi) |
17.0 |
1 |
17.5 |
2 |
18.0 |
1 |
18.2 |
2 |
18.5 |
2 |
18.9 |
4 |
20.9 |
3 |
23.5 |
2 |
24.6 |
1 |
24.7 |
1 |
25.5 |
1 |
Total |
20 |
Observe que na tabela todos os valores de dados obtidos estão apresentados e, portanto, não há perda de informação.
Frequência absoluta (Fi)
Definimos como frequência absoluta (fi) o número de vezes que o dado aparece na amostra, ou, no caso de estarmos apresentando uma distribuição de frequência por classes, o número de elementos pertencentes a uma classe.
Tabela 2 - Distribuição de frequência com intervalos de classe para a produção de leite.
ProduÇÃo de leite (kg.dia-¹) |
FrequÊncia absoluta (fi) |
17,0 ├ 18,7 |
8 |
18,7 ├ 20,4 |
4 |
20,4 ├ 22,1 |
3 |
22,1 ├ 23,8 |
2 |
23,8 ├ 25,5 |
3 |
Total |
20 |
A soma das frequências absolutas é igual ao número total de dados:
Limites de classe
Na Tabela 2 aparece uma notação (├) que é utilizada para identificar os limites da classe e significa que estão incluídos os valores mínimos e excluídos os valores máximos, ou seja, na classe 18,7 ├ 20,4 estão computados os valores de 18,7 (inclusive) a 20,4 (exclusive). Esta é a notação que deve ser utilizada para identificar os limites de classe, de acordo com a Resolução 866/66 do IBGE, ou seja, desta quantidade até menos aquela.
Outras notações:
18,7 ┤20,4 – excluído o valor correspondente ao limite inferior e incluído o valor correspondente ao limite superior.
18,7 │─│20,4 – incluídos os valores entre 18,7 e 20,4 (excluídos os valores 18,7 e 20,4).
O menor número é o limite inferior da classe (li) e o maior número, o limite superiorda classe (Li).
Número de Intervalos de Classe (k)
Para definirmos o número de classes em que os dados serão divididos, podemos utilizar as seguintes fórmulas, sendo n= tamanho da amostra:
Fórmula de Sturges:
Em nosso exemplo, da Tabela 2:
a) n= 20 à k = 5
b) k = 1 + 3,32 log (20); k = 5,29 arredondando k = 5,0.
Na montagem de uma tabela de distribuição de frequência não há uma fórmula exata para o número de intervalos de classes. As que apresentamos acima são para encontrarmos um primeiro valor. Via de regra, devemos usar no mínimo 5 e no máximo 15 classes. Menos de cinco classes perdemos muita informação e, mais do que 15 classes, a tabela fica muito extensa, dificultando a interpretação dos dados.
Amplitude do intervalo de classe (h)
Calculamos a amplitude de cada classe dividindo a amplitude total pelo número de classes (k). Assim, para o exemplo, temos amplitude total de 8,5 e k=5, logo,a amplitude de cada intervalo de classe será 1,7 (8,5 / 5 = 1,7).
Geralmente, mas não obrigatoriamente, iniciamos a primeira classe pelo menor valor do conjunto de dados, somando o valor da amplitude de classe para encontrar o limite superior, e assim sucessivamente, até a última classe que poderá, ou não, ter o maior valor da variável em estudo como o limite superior da classe.
Em uma tabela de distribuição de frequência com intervalos de classe ganhamos simplicidade, mas perdemos informação. No exemplo da Tabela 2 podemos observar que 8 vacas produziram entre 17,0 e 18,7 kg de leite por dia, mas não sabemos exatamente quanto cada uma produziu.
Frequência relativa (fri):
A frequência relativa é dada pela razão entre a frequência absoluta de cada classe e a frequência total ou soma das frequências absolutas:
A utilização da frequência relativa facilita as comparações entre mais de um conjunto de dados com diferentes números de elementos.
A soma das frequências relativas é sempre igual a 1.
Na Tabela 3 pode ser observada a frequência relativa de cada classe para o exemplo dado anteriormente.
Frequência acumulada (F):
A frequência acumulada é a soma da frequência absoluta da classe em questão com as frequências absolutas das classes anteriores, sendo a frequência acumulada da última classe igual ao número total de observações.
A Tabela 3 apresenta uma distribuição de frequência, onde podem ser visualizados todos os tipos de frequência.
Tabela 3 - Distribuição de frequência em classes para a variável produção de leite.
Classe (i) |
ProduÇÃo de leite (kg.dia-¹) |
fi |
xi |
fri |
Fi |
Fri |
fpi |
Fpi |
1 |
17,0 I--- 18,7 |
8 |
17,85 |
0,40 |
8 |
0,40 |
40,0 |
40,0 |
2 |
18,7 I--- 20,4 |
4 |
19,55 |
0,20 |
12 |
0,60 |
20,0 |
60,0 |
3 |
20,4 I--- 22,1 |
3 |
21,25 |
0,15 |
15 |
0,75 |
15,0 |
75,0 |
4 |
22,1 I--- 23,8 |
2 |
22,95 |
0,10 |
17 |
0,85 |
10,0 |
85,0 |
5 |
23,8 I--- 25,5 |
3 |
24,65 |
0,15 |
20 |
1,0 |
15,0 |
100 |
|
∑=20 |
|
∑=1,0 |
|
∑=100 |
|
Frequência acumulada relativa (Fri):
É dada pela frequência acumulada (F) da classe, dividida pela frequência total (∑fi) do conjunto de dados. A frequência acumulada da última classe é igual à unidade.
Frequência percentual (fpi):
A frequência percentual é obtida pela multiplicação da frequência relativa por cem (100):
Frequência acumulada percentual (Fpi):
A frequência acumulada percentual é obtida pela multiplicação da frequência acumulada relativa por cem (100):
A frequência acumulada percentual da última classe é igual a 100.
Ponto médio de uma classe (xi):
O ponto médio de uma classe, como diz o nome, é o ponto que divide o intervalo de classe em duas partes iguais. É dado pela soma dos limites inferior e superior da classe dividido por dois.
Assim, para o exemplo apresentado (Tabela 3), o ponto médio da classe 3 é dado por:
x3= (l3+L3)/2 à x3 = 20,4 + 22,1 / 2 à x3 = 42,5 / 2 à x3 = 21,25.
O ponto médio de uma classe é o valor que a representa.
O conhecimento dos valores referentes aos vários tipos de frequência, como apresentado na Tabela 3, ajuda-nos a responder alguns questionamentos com relativa facilidade, tais como os seguintes:
a) Quantas vacas produzem menos do que 20,4 kg de leite por dia?
Esse valor refere-se ao limite superior da segunda classe e, portanto, a resposta é igual à frequência acumulada da segunda classe (F2): 12 animais ou 60% (Fp2).
b) Quantas vacas produzem mais do que 23,8 kg de leite por dia?
Esse valor é o limite inferior da quinta classe, logo: 3 animais produzem mais do que 23,8 kg de leite diários (f5) ou 15,0% do total (fp5).