O que é homocedástico?
Homocedástico (também denominado "homoscedástico") refere-se a uma condição na qual a variação do residual, ou termo de erro, em um modelo de regressão é constante. Ou seja, o termo do erro não varia muito conforme o valor da variável preditora muda. No entanto, a falta de homocedasticidade pode sugerir que o modelo de regressão pode precisar incluir variáveis preditoras adicionais para explicar o desempenho da variável dependente.
Principais Takeaways
- A homocedasticidade ocorre quando a variação do termo de erro em um modelo de regressão é constante. Se a variância do termo de erro é homosquástica, o modelo foi bem definido. Se houver muita variação, o modelo pode não estar bem definido. A adição de variáveis preditoras adicionais pode ajudar a explicar o desempenho da variável dependente. Por outro lado, a heterocedasticidade ocorre quando a variação do termo de erro não é constante.
Como funciona o homocedástico
A homocedasticidade é uma suposição da modelagem de regressão linear. Se a variação dos erros ao redor da linha de regressão variar muito, o modelo de regressão pode estar mal definido. O oposto da homocedasticidade é a heterocedasticidade, assim como o oposto de "homogêneo" é "heterogêneo". Heterocedasticidade (também denominada “heterocedasticidade”) refere-se a uma condição na qual a variação do termo de erro em uma equação de regressão não é constante.
Ao considerar que a variação é a diferença medida entre o resultado previsto e o resultado real de uma determinada situação, a determinação da homocedasticidade pode ajudar a determinar quais fatores precisam ser ajustados para a precisão.
Considerações Especiais
Um modelo de regressão simples, ou equação, consiste em quatro termos. No lado esquerdo é a variável dependente. Representa o fenômeno que o modelo procura "explicar". No lado direito, há um constante, uma variável preditora e um termo residual ou de erro. O termo de erro mostra a quantidade de variabilidade na variável dependente que não é explicada pela variável preditora.
Exemplo de homocedástico
Por exemplo, suponha que você queira explicar as notas dos testes dos alunos usando o tempo que cada aluno passou estudando. Nesse caso, a pontuação do teste seria a variável dependente e o tempo gasto no estudo seria a variável preditora.
O termo de erro mostraria a quantidade de variação nas pontuações do teste que não foi explicada pela quantidade de tempo estudando. Se essa variação é uniforme ou homosquástica, isso sugere que o modelo pode ser uma explicação adequada para o desempenho do teste - explicando-o em termos de tempo gasto no estudo.
Mas a variação pode ser heterocedástica. Um gráfico dos dados do termo de erro pode mostrar que uma grande quantidade de tempo de estudo correspondeu muito de perto com altas pontuações nos testes, mas essas pontuações baixas nos testes variaram muito e até incluíram pontuações muito altas. Portanto, a variação das pontuações não seria bem explicada simplesmente por uma variável preditora - a quantidade de tempo estudando. Nesse caso, provavelmente algum outro fator está em ação, e o modelo pode precisar ser aprimorado para identificá-lo. Uma investigação mais aprofundada pode revelar que alguns alunos viram as respostas antes do teste ou que fizeram um teste semelhante anteriormente e, portanto, não precisavam estudar para esse teste em particular.
Para melhorar o modelo de regressão, o pesquisador acrescentaria, portanto, outra variável explicativa indicando se um aluno havia visto as respostas antes do teste. O modelo de regressão teria então duas variáveis explicativas - tempo estudando e se o aluno tinha conhecimento prévio das respostas. Com essas duas variáveis, mais da variância das pontuações do teste seria explicada e a variância do termo de erro poderia ser homosquástica, sugerindo que o modelo estava bem definido.
