O que é uma estatística do qui-quadrado?
Um qui-quadrado ( χ 2) estatística é um teste que mede como as expectativas se comparam aos dados reais observados (ou resultados do modelo). Os dados usados no cálculo de uma estatística do qui-quadrado devem ser aleatórios, brutos, mutuamente exclusivos, extraídos de variáveis independentes e extraídos de uma amostra grande o suficiente. Por exemplo, os resultados do lançamento de uma moeda 100 vezes atendem a esses critérios.
Testes de qui-quadrado são freqüentemente usados em testes de hipóteses.
A fórmula para o qui-quadrado é
χc2 = Oi (Oi-Ei) 2Eiwhere: c = graus de liberdadeO = valor (es) observado (s) E = valor (es) esperado (s) begin {alinhado} & \ chi ^ 2_c = \ sum \ frac {(O_i - E_i) ^ 2} {E_i} \ & \ textbf {onde:} \ & c = \ text {graus de liberdade} \ & O = \ text {valor (es) observado (s)} \ & E = \ text {valor esperado } \ \ end {alinhado} χc2 = ∑Ei (Oi −Ei) 2 onde: c = graus de liberdadeO = valor (es) observado (s) E = valor (es) esperado (s)
O que uma estatística do qui-quadrado lhe diz?
Existem dois tipos principais de testes do qui-quadrado: o teste da independência, que faz uma pergunta de relacionamento, como "Existe uma relação entre gênero e notas no SAT?"; e o teste de adequação, que pergunta algo como "Se uma moeda for lançada 100 vezes, ela subirá cara 50 vezes e coroa 50 vezes?"
Para esses testes, os graus de liberdade são utilizados para determinar se uma determinada hipótese nula pode ser rejeitada com base no número total de variáveis e amostras no experimento.
Por exemplo, ao considerar os alunos e a escolha do curso, um tamanho de amostra de 30 ou 40 alunos provavelmente não é grande o suficiente para gerar dados significativos. Obter resultados iguais ou semelhantes em um estudo usando uma amostra de 400 ou 500 alunos é mais válido.
Em outro exemplo, considere jogar uma moeda 100 vezes. O resultado esperado de jogar uma moeda justa 100 vezes é que as cabeças subem 50 vezes e as caudas subem 50 vezes. O resultado real pode ser que as cabeças subam 45 vezes e as caudas subam 55 vezes. A estatística qui-quadrado mostra quaisquer discrepâncias entre os resultados esperados e os resultados reais.
Exemplo de um teste qui-quadrado
Imagine que uma pesquisa aleatória foi realizada entre 2.000 eleitores diferentes, homens e mulheres. As pessoas que responderam foram classificadas por gênero e se eram republicanas, democratas ou independentes. Imagine uma grade com as colunas rotuladas republicana, democrata e independente e duas linhas rotuladas masculino e feminino. Suponha que os dados dos 2.000 participantes sejam os seguintes:
O primeiro passo para calcular a estatística chi ao quadrado é encontrar as frequências esperadas. Eles são calculados para cada "célula" na grade. Como existem duas categorias de gênero e três categorias de visão política, existem seis frequências totais esperadas. A fórmula para a frequência esperada é:
E (r, c) = n (r) × c (r) onde: r = linha na perguntac = coluna no questionn = total correspondente \ begin {alinhado} & E (r, c) = \ frac {n (r) times c (r)} {n} \ & \ textbf {onde:} \ & r = \ text {linha em questão} \ & c = \ text {coluna em questão} \ & n = \ text {total correspondente} \ \ end {alinhado} E (r, c) = nn (r) × c (r) onde: r = linha na perguntac = coluna na perguntan = total correspondente
Neste exemplo, as frequências esperadas são:
- E (1, 1) = (900 x 800) / 2.000 = 360E (1, 2) = (900 x 800) / 2.000 = 360E (1, 3) = (200 x 800) / 2.000 = 80E (2, 1) = (900 x 1.200) / 2.000 = 540E (2, 2) = (900 x 1.200) / 2.000 = 540E (2, 3) = (200 x 1.200) / 2.000 = 120
Em seguida, esses são valores usados para calcular a estatística chi ao quadrado usando a seguinte fórmula:
Qui-quadrado = ∑2E (r, c) onde: O (r, c) = dados observados para a linha e coluna especificadas \ begin {alinhado} e \ text {Qui-quadrado} = \ sum \ frac {^ 2} {E (r, c)} \ & \ textbf {onde:} \ & O (r, c) = \ text {dados observados para a linha e coluna especificadas} \ \ end {alinhado} Qui-quadrado = ∑E (r, c) 2 em que: O (r, c) = dados observados para a linha e coluna especificadas
Neste exemplo, a expressão para cada valor observado é:
- O (1, 1) = (400 - 360) 2/360 = 4, 44 O (1, 2) = (300 - 360) 2/360 = 10O (1, 3) = (100 - 80) 2/80 = 5O (2, 1) = (500 - 540) 2/540 = 2, 96O (2, 2) = (600 - 540) 2/540 = 6, 67O (2, 3) = (100 - 120) 2/120 = 3, 33
A estatística do qui-quadrado então é igual à soma desses valores, ou 32, 41. Podemos então olhar para uma tabela estatística qui-quadrado para ver, dados os graus de liberdade em nossa configuração, se o resultado é estatisticamente significativo ou não.
