O que é multicolinearidade?
Multicolinearidade é a ocorrência de altas intercorrelações entre variáveis independentes em um modelo de regressão múltipla. A multicolinearidade pode levar a resultados distorcidos ou enganosos quando um pesquisador ou analista tenta determinar até que ponto cada variável independente pode ser usada com mais eficiência para prever ou entender a variável dependente em um modelo estatístico. Em geral, a multicolinearidade pode levar a intervalos de confiança mais amplos e valores de probabilidade menos confiáveis para as variáveis independentes. Ou seja, as inferências estatísticas de um modelo com multicolinearidade podem não ser confiáveis.
Noções básicas sobre multicolinearidade
Os analistas estatísticos usam vários modelos de regressão para prever o valor de uma variável dependente especificada com base nos valores de duas ou mais variáveis independentes. A variável dependente às vezes é chamada de variável de resultado, destino ou critério. Um exemplo é um modelo de regressão multivariada que tenta antecipar o retorno das ações com base em itens como índices preço / lucro, capitalização de mercado, desempenho passado ou outros dados. O retorno do estoque é a variável dependente e os vários bits de dados financeiros são as variáveis independentes.
Principais Takeaways
- A multicolinearidade é um conceito estatístico em que as variáveis independentes em um modelo são correlacionadas. A multicolinearidade entre variáveis independentes resultará em inferências estatísticas menos confiáveis..
A multicolinearidade em um modelo de regressão múltipla indica que variáveis independentes colineares estão relacionadas de alguma forma, embora o relacionamento possa ou não ser casual. Por exemplo, o desempenho passado pode estar relacionado à capitalização de mercado, pois as ações que tiveram um bom desempenho no passado terão valores de mercado crescentes. Em outras palavras, a multicolinearidade pode existir quando duas variáveis independentes são altamente correlacionadas. Também pode acontecer se uma variável independente for calculada a partir de outras variáveis no conjunto de dados ou se duas variáveis independentes fornecerem resultados semelhantes e repetitivos.
Uma das maneiras mais comuns de eliminar o problema da multicolinearidade é primeiro identificar variáveis independentes colineares e depois remover todas, exceto uma. Também é possível eliminar a multicolinearidade combinando duas ou mais variáveis colineares em uma única variável. A análise estatística pode então ser conduzida para estudar a relação entre a variável dependente especificada e apenas uma única variável independente.
Exemplo de multicolinearidade
Para investir, a multicolinearidade é uma consideração comum ao executar análises técnicas para prever prováveis movimentos futuros dos preços de um título, como um futuro de ações ou mercadorias. Os analistas de mercado desejam evitar o uso de indicadores técnicos que são colineares, pois são baseados em dados muito semelhantes ou relacionados; eles tendem a revelar previsões semelhantes em relação à variável dependente do movimento dos preços. Em vez disso, a análise de mercado deve se basear em variáveis independentes marcadamente diferentes para garantir que eles analisem o mercado a partir de diferentes pontos de vista analíticos independentes.
O notável analista técnico John Bollinger, criador do indicador Bollinger Bands, observa que "uma regra fundamental para o uso bem-sucedido da análise técnica requer evitar a multicolinearidade entre os indicadores".
Para resolver o problema, os analistas evitam usar dois ou mais indicadores técnicos do mesmo tipo. Em vez disso, eles analisam uma segurança usando um tipo de indicador, como um indicador de momento e, em seguida, fazem análises separadas usando um tipo diferente de indicador, como um indicador de tendência.
Um exemplo de um potencial problema de multicolinearidade está executando a análise técnica apenas usando vários indicadores semelhantes, como estocásticos, o índice de força relativa (RSI) e Williams% R, que são indicadores de momento que dependem de entradas semelhantes e provavelmente produzem similar resultados. Nesse caso, é melhor remover todos os indicadores, exceto um, ou encontrar uma maneira de mesclar vários deles em apenas um indicador, além de adicionar um indicador de tendência que provavelmente não está altamente correlacionado com o indicador de momento.
