O que é intervalo de confiança?
Um intervalo de confiança, nas estatísticas, refere-se à probabilidade de um parâmetro populacional cair entre dois valores definidos por uma determinada proporção de vezes. Intervalos de confiança medem o grau de incerteza ou certeza em um método de amostragem. Um intervalo de confiança pode assumir qualquer número de probabilidades, sendo o mais comum um nível de confiança de 95% ou 99%.
Intervalo de confiança e nível de confiança estão inter-relacionados, mas não são exatamente os mesmos.
Entendendo o intervalo de confiança
Os estatísticos usam intervalos de confiança para medir a incerteza. Por exemplo, um pesquisador seleciona amostras diferentes aleatoriamente da mesma população e calcula um intervalo de confiança para cada amostra. Os conjuntos de dados resultantes são todos diferentes; alguns intervalos incluem o parâmetro verdadeiro da população e outros não.
Um intervalo de confiança é um intervalo de valores que provavelmente conteria um parâmetro de população desconhecido. O nível de confiança refere-se à porcentagem de probabilidade ou certeza de que o intervalo de confiança conteria o parâmetro verdadeiro da população quando você extrai uma amostra aleatória várias vezes. Ou, no vernáculo, "temos 99% de certeza ( nível de confiança) de que a maioria desses conjuntos de dados (intervalos de confiança) contém o verdadeiro parâmetro populacional".
Principais Takeaways
- Um intervalo de confiança calcula a probabilidade de um parâmetro populacional cair entre dois valores definidos. Os intervalos de confiança medem o grau de incerteza ou certeza em um método de amostragem. Na maioria das vezes, os intervalos de confiança refletem níveis de confiança de 95% ou 99%.
Cálculo de um intervalo de confiança
Suponha que um grupo de pesquisadores esteja estudando as alturas dos jogadores de basquete do ensino médio. Os pesquisadores coletam uma amostra aleatória da população e estabelecem uma altura média de 74 polegadas. A média de 74 polegadas é uma estimativa pontual da média da população. Uma estimativa pontual por si só é de utilidade limitada, porque não revela a incerteza associada à estimativa; você não tem uma boa noção de quão longe essa média amostral de 74 polegadas pode estar da média populacional. O que falta é o grau de incerteza nesta amostra única.
Intervalos de confiança fornecem mais informações do que estimativas pontuais. Ao estabelecer um intervalo de confiança de 95% usando a média e o desvio padrão da amostra e assumindo uma distribuição normal representada pela curva de sino, os pesquisadores chegam a um limite superior e inferior que contém a verdadeira média em 95% das vezes. Suponha que o intervalo esteja entre 72 e 76 polegadas. Se os pesquisadores coletarem 100 amostras aleatórias da população de jogadores de basquete do ensino médio como um todo, a média deve cair entre 72 e 76 polegadas em 95 dessas amostras.
Se os pesquisadores querem uma confiança ainda maior, eles podem expandir o intervalo para 99% de confiança. Fazer isso invariavelmente cria uma gama mais ampla, pois abre espaço para um número maior de meios de amostra. Se eles estabelecerem o intervalo de confiança de 99% entre 70 polegadas e 78 polegadas, poderão esperar que 99 de 100 amostras avaliadas contenham um valor médio entre esses números. Um nível de confiança de 90% significa que esperaríamos que 90% das estimativas de intervalo incluíssem o parâmetro populacional. Da mesma forma, um nível de confiança de 99% significa que 95% dos intervalos incluiriam o parâmetro.
Equívocos comuns sobre o intervalo de confiança
O maior equívoco em relação aos intervalos de confiança é que eles representam a porcentagem de dados de uma determinada amostra que fica entre os limites superior e inferior. Por exemplo, pode-se interpretar erroneamente o intervalo de confiança de 99% acima mencionado, de 70 a 78 polegadas como indicando que 99% dos dados em uma amostra aleatória se enquadram entre esses números. Isso está incorreto, embora exista um método separado de análise estatística para fazer essa determinação. Fazer isso envolve identificar a média e o desvio padrão da amostra e plotar esses números em uma curva de sino.
