Unidade K –Estimação e Intervalos de Confiança

Intervalos de Confiança

O intervalo de confiança é uma estimativa intervalar que inclui uma afirmação probabilística. Essa informação indica a percentagem de intervalos que podemos esperar abranger o verdadeiro valor do parâmetro em seus limites. A amplitude de um intervalo de confiança depende de quatro itens:

Vamos recorrer aos conceitos estudados na Aula 7, Modelos teóricos de distribuição de probabilidade, onde conceituamos a variável padronizada Z que corresponde a um determinado valor afastado da média, na curva normal padronizada.

Uma das propriedades da curva normal padronizada é que 68% da estatística amostral está a menos de um desvio padrão de cada lado da média da distribuição amostral (a qual é igual a média da população, em se tratando de distribuição normal), 95,5% dos valores estão a dois desvios padrões em ambos os lados da média e que em torno de 0,3% da estatística amostral está a mais de três desvios padrões da média. A Figura 2 ilustra a distribuição normal padronizada com as respectivas probabilidades e desvios padrões da média.

Vimos também na Aula 7, que a área sob a curva normal padronizada até um determinado valor Z não necessita de cálculo, apenas de consulta à Tabela da curva normal padrão, e que a área representa uma probabilidade.

Assim, se considerarmos que a média de uma amostra está a menos de 1,96 desvios padrões a contar da média verdadeira, podemos esperar estar certos 95% das vezes e errados 5% das vezes (consultando a Tabela da curva normal padrão, ao valor de 1,96 desvios corresponde um valor z= 0,475, logo: 0,475 x 2 = 0,95 e 1-α = 0,05).

Pode-se facilmente perceber que a média amostral poderá estar mais próxima da verdadeira média do que 1,96, ou mais afastada, sendo essa uma atribuição probabilística do intervalo em que o verdadeiro valor possa estar (STEVENSON, 2001).

A esse intervalo denominamos de Intervalo de Confiança, e a nossa confiabilidade é 1-P (erro). Assim, um intervalo de confiança de 95% carrega consigo um risco de erro igual a 5%.

O risco de erro diminui com o aumento do valor de Z, ou do número de desvios padrões afastados da média, entretanto aumenta o intervalo de valores que a média deverá estar.

Em geral, o nível de confiança é simbolizado por (1- α) X 100%, onde α é a proporção de caudas da distribuição que estão fora do intervalo de confiança.

Erro de estimação

Em um intervalo de estimação, o erro refere-se ao desvio (ou diferença) entre a média amostral e a verdadeira média populacional. Uma vez que o intervalo de confiança tem centro na média amostral, o erro máximo provável é igual à metade da amplitude do intervalo de confiança, sendo calculado como:

Logo, o intervalo de confiança será:

Onde:

= média amostral

Z = valor da variável padronizada, conforme o nível de confiança desejado

σx = desvio padrão populacional

n= número de observações (tamanho da amostra)

A utilização desse método, com a curva normal padronizada, é válido somente quando conhecemos o desvio padrão s populacional, ou seja, para grandes amostras (n>30).

A fórmula apresentada para o erro nos mostra que há efetivamente três determinantes do tamanho ou da quantidade de erro na estimativa:

Os fatores Z e σx (numerador) têm efeito direto no erro, ou seja, quanto maior o nível de confiança desejado ou a dispersão da população, maior o erro potencial. O tamanho da amostra, n, por estar no denominador tem efeito inverso no erro, ou seja, para grandes amostras o erro potencial é menor.

Com a fórmula do erro, através de manipulações algébricas, podemos determinar a quantidade de erro associada à dispersão de uma população, ou o tamanho da amostra, ou ainda o intervalo de confiança, partindo do pressuposto de as demais variáveis estarem definidas.

Determinação do tamanho da amostra

Para determinar o tamanho da amostra que deve ser coletada para atender os demais pressupostos fazemos:

Assim, o tamanho n da amostra necessária dependerá do grau de confiança desejado, da dispersão entre os valores da população e do erro tolerável.

Exemplo 1:

Qual o tamanho necessário da amostra para produzir uma estimativa com intervalo de confiança de 95% para a verdadeira média populacional, com um erro tolerável de 1,0 unidades em qualquer dos sentidos, se o desvio padrão da população é 6,0 unidades?

Solução:

São determinados:

σx = 6,0

erro: e = 1,0

intervalo de confiança = 95%, logo, o valor de Z = 1,96.

Logo:

O que resulta em n = 138,29 (arredonda-se sempre para o próximo inteiro) n = 139

 

Na próxima aula veremos como estimar a média populacional nas situações em que o desvio padrão é conhecido e quando é desconhecido.