Unidade C –Estatística Descritiva - Distribuição de Frequência

Distribuição de Frequência

Uma distribuição de frequência é uma série estatística na qual os dados estão organizados em grupos de classes ou categorias estabelecidas convenientemente.

As distribuições de frequência podem ser divididas em dois tipos:

Para o exemplo apresentado, valores diários de produção de leite de vinte vacas holandesas, a distribuição de frequência sem intervalos de classes, ou pontual, é:

Tabela 1 – Distribuição de frequência pontual para a produção de leite.

ProduÇÃo de leite (kg.dia-¹)

FrequÊncia absoluta (fi)

17.0

1

17.5

2

18.0

1

18.2

2

18.5

2

18.9

4

20.9

3

23.5

2

24.6

1

24.7

1

25.5

1

Total

20

Observe que na tabela todos os valores de dados obtidos estão apresentados e, portanto, não há perda de informação.

Frequência absoluta (Fi)

Definimos como frequência absoluta (fi) o número de vezes que o dado aparece na amostra, ou, no caso de estarmos apresentando uma distribuição de frequência por classes, o número de elementos pertencentes a uma classe.

Tabela 2 - Distribuição de frequência com intervalos de classe para a produção de leite.

ProduÇÃo de leite (kg.dia-¹)

FrequÊncia absoluta (fi)

17,0 ├ 18,7

8

18,7 ├ 20,4

4

20,4 ├ 22,1

3

22,1 ├ 23,8

2

23,8 ├ 25,5

3

Total

20

A soma das frequências absolutas é igual ao número total de dados:

Limites de classe

Na Tabela 2 aparece uma notação (├) que é utilizada para identificar os limites da classe e significa que estão incluídos os valores mínimos e excluídos os valores máximos, ou seja, na classe 18,7 ├ 20,4 estão computados os valores de 18,7 (inclusive) a 20,4 (exclusive). Esta é a notação que deve ser utilizada para identificar os limites de classe, de acordo com a Resolução 866/66 do IBGE, ou seja, desta quantidade até menos aquela.

Outras notações:

18,7 ┤20,4 – excluído o valor correspondente ao limite inferior e incluído o valor correspondente ao limite superior.

18,7 │─│20,4 – incluídos os valores entre 18,7 e 20,4 (excluídos os valores 18,7 e 20,4).

O menor número é o limite inferior da classe (li) e o maior número, o limite superiorda classe (Li).

Número de Intervalos de Classe (k)

Para definirmos o número de classes em que os dados serão divididos, podemos utilizar as seguintes fórmulas, sendo n= tamanho da amostra:

Fórmula de Sturges:

Em nosso exemplo, da Tabela 2:

a) n= 20 à k = 5

b) k = 1 + 3,32 log (20); k = 5,29 arredondando k = 5,0.

Na montagem de uma tabela de distribuição de frequência não há uma fórmula exata para o número de intervalos de classes. As que apresentamos acima são para encontrarmos um primeiro valor. Via de regra, devemos usar no mínimo 5 e no máximo 15 classes. Menos de cinco classes perdemos muita informação e, mais do que 15 classes, a tabela fica muito extensa, dificultando a interpretação dos dados.

Amplitude do intervalo de classe (h)

Calculamos a amplitude de cada classe dividindo a amplitude total pelo número de classes (k). Assim, para o exemplo, temos amplitude total de 8,5 e k=5, logo,a amplitude de cada intervalo de classe será 1,7 (8,5 / 5 = 1,7).

Geralmente, mas não obrigatoriamente, iniciamos a primeira classe pelo menor valor do conjunto de dados, somando o valor da amplitude de classe para encontrar o limite superior, e assim sucessivamente, até a última classe que poderá, ou não, ter o maior valor da variável em estudo como o limite superior da classe.

Em uma tabela de distribuição de frequência com intervalos de classe ganhamos simplicidade, mas perdemos informação. No exemplo da Tabela 2 podemos observar que 8 vacas produziram entre 17,0 e 18,7 kg de leite por dia, mas não sabemos exatamente quanto cada uma produziu.

Frequência relativa (fri):

A frequência relativa é dada pela razão entre a frequência absoluta de cada classe e a frequência total ou soma das frequências absolutas:

A utilização da frequência relativa facilita as comparações entre mais de um conjunto de dados com diferentes números de elementos.

A soma das frequências relativas é sempre igual a 1.

Na Tabela 3 pode ser observada a frequência relativa de cada classe para o exemplo dado anteriormente.

Frequência acumulada (F):

A frequência acumulada é a soma da frequência absoluta da classe em questão com as frequências absolutas das classes anteriores, sendo a frequência acumulada da última classe igual ao número total de observações.

A Tabela 3 apresenta uma distribuição de frequência, onde podem ser visualizados todos os tipos de frequência.

Tabela 3 - Distribuição de frequência em classes para a variável produção de leite.

Classe (i)

ProduÇÃo de leite (kg.dia-¹)

fi

xi

fri

Fi

Fri

fpi

Fpi

1

17,0 I--- 18,7

8

17,85

0,40

8

0,40

40,0

40,0

2

18,7 I--- 20,4

4

19,55

0,20

12

0,60

20,0

60,0

3

20,4 I--- 22,1

3

21,25

0,15

15

0,75

15,0

75,0

4

22,1 I--- 23,8

2

22,95

0,10

17

0,85

10,0

85,0

5

23,8 I--- 25,5

3

24,65

0,15

20

1,0

15,0

100

 

∑=20

 

∑=1,0

 

∑=100

 

Frequência acumulada relativa (Fri):

É dada pela frequência acumulada (F) da classe, dividida pela frequência total (∑fi) do conjunto de dados. A frequência acumulada da última classe é igual à unidade.

Frequência percentual (fpi):

A frequência percentual é obtida pela multiplicação da frequência relativa por cem (100):

Frequência acumulada percentual (Fpi):

A frequência acumulada percentual é obtida pela multiplicação da frequência acumulada relativa por cem (100):

A frequência acumulada percentual da última classe é igual a 100.

Ponto médio de uma classe (xi):

O ponto médio de uma classe, como diz o nome, é o ponto que divide o intervalo de classe em duas partes iguais. É dado pela soma dos limites inferior e superior da classe dividido por dois.

Assim, para o exemplo apresentado (Tabela 3), o ponto médio da classe 3 é dado por:

x3= (l3+L3)/2 à x3 = 20,4 + 22,1 / 2 à x3 = 42,5 / 2 à x3 = 21,25.

O ponto médio de uma classe é o valor que a representa.

O conhecimento dos valores referentes aos vários tipos de frequência, como apresentado na Tabela 3, ajuda-nos a responder alguns questionamentos com relativa facilidade, tais como os seguintes:

a) Quantas vacas produzem menos do que 20,4 kg de leite por dia?

Esse valor refere-se ao limite superior da segunda classe e, portanto, a resposta é igual à frequência acumulada da segunda classe (F2): 12 animais ou 60% (Fp2).

b) Quantas vacas produzem mais do que 23,8 kg de leite por dia?

Esse valor é o limite inferior da quinta classe, logo: 3 animais produzem mais do que 23,8 kg de leite diários (f5) ou 15,0% do total (fp5).