O que é um fator de inflação de variação?
Inflação de variação O fator de inflação de variação (VIF) é uma medida da quantidade de multicolinearidade em um conjunto de múltiplas variáveis de regressão. Matematicamente, o VIF para uma variável de modelo de regressão é igual à razão entre a variação geral do modelo e a variação de um modelo que inclui apenas essa variável independente única. Essa relação é calculada para cada variável independente. Um VIF alto indica que a variável independente associada é altamente colinear com as outras variáveis no modelo.
Principais Takeaways
- Um fator de inflação de variância (VIF) fornece uma medida de multicolinearidade entre as variáveis independentes em um modelo de regressão múltipla.A detecção da multicolinearidade é importante porque, embora não reduza o poder explicativo do modelo, reduz a significância estatística das variáveis independentes. Um VIF grande em uma variável independente indica uma relação altamente colinear com as outras variáveis que devem ser consideradas ou ajustadas na estrutura do modelo e seleção de variáveis independentes.
Entendendo um fator de inflação de variação
Uma regressão múltipla é usada quando uma pessoa deseja testar o efeito de várias variáveis em um resultado específico. A variável dependente é o resultado que está sendo acionado pelas variáveis independentes, que são as entradas para o modelo. A multicolinearidade existe quando existe uma relação linear ou correlação entre uma ou mais das variáveis ou entradas independentes. A multicolinearidade cria um problema na regressão múltipla porque, como as entradas estão todas se influenciando, elas não são realmente independentes e é difícil testar o quanto a combinação das variáveis independentes afeta a variável dependente, ou resultado, dentro do modelo de regressão.. Em termos estatísticos, um modelo de regressão múltipla em que há alta colinearidade tornará mais difícil estimar a relação entre cada uma das variáveis independentes e a variável dependente. Pequenas mudanças nos dados utilizados ou na estrutura da equação do modelo podem produzir mudanças grandes e erráticas nos coeficientes estimados nas variáveis independentes.
Para garantir que o modelo esteja especificado e funcionando corretamente, existem testes que podem ser executados quanto à multicolinearidade. O fator de inflação da variação é uma dessas ferramentas de medição. O uso de fatores de inflação de variação ajuda a identificar a gravidade de quaisquer problemas de multicolinearidade para que o modelo possa ser ajustado. O fator de inflação de variação mede quanto o comportamento (variação) de uma variável independente é influenciado ou inflado por sua interação / correlação com as outras variáveis independentes. Os fatores de inflação de variação permitem uma medida rápida de quanto uma variável está contribuindo para o erro padrão na regressão. Quando existirem questões significativas de multicolinearidade, o fator de inflação da variação será muito grande para as variáveis envolvidas. Depois que essas variáveis são identificadas, várias abordagens podem ser usadas para eliminar ou combinar variáveis colineares, resolvendo o problema da multicolinearidade.
Embora a multicolinearidade não reduz o poder preditivo geral de um modelo, ela pode produzir estimativas dos coeficientes de regressão que não são estatisticamente significativos. Em certo sentido, pode ser pensado como uma espécie de contagem dupla no modelo. Quando duas ou mais variáveis independentes estão intimamente relacionadas ou medem quase a mesma coisa, o efeito subjacente que elas medem está sendo contabilizado duas vezes (ou mais) nas variáveis, e fica difícil ou impossível dizer qual variável está realmente influenciando o variável independente. Isso é um problema porque o objetivo de muitos modelos econométricos é testar exatamente esse tipo de relação estatística entre as variáveis independentes e a variável dependente.
Por exemplo, se um economista deseja testar se existe uma relação estatisticamente significativa entre a taxa de desemprego (como variável independente) e a taxa de inflação (como variável dependente). A inclusão de variáveis independentes adicionais relacionadas à taxa de desemprego, como uma nova reivindicação inicial de desemprego, provavelmente introduziria multicolinearidade no modelo. O modelo geral pode mostrar um poder explicativo forte, estatisticamente suficiente, mas não conseguir identificar se o efeito se deve principalmente à taxa de desemprego ou às novas reivindicações iniciais de desemprego. Isso é o que o VIF detectaria e sugeriria possivelmente deixar uma das variáveis fora do modelo ou encontrar alguma maneira de consolidá-las para capturar seu efeito conjunto, dependendo da hipótese específica que o pesquisador estiver interessado em testar.
