O que é regressão passo a passo?
A análise de regressão é uma abordagem estatística amplamente usada que busca identificar relacionamentos entre variáveis. A idéia é reunir dados relevantes para tomar decisões mais bem informadas e é uma prática comum no mundo dos investimentos. A regressão passo a passo é a construção iterativa passo a passo de um modelo de regressão que envolve a seleção automática de variáveis independentes. A disponibilidade de pacotes de software estatístico possibilita a regressão gradual, mesmo em modelos com centenas de variáveis.
Tipos de regressão passo a passo
O objetivo subjacente da regressão passo a passo é, através de uma série de testes (testes F, testes t), encontrar um conjunto de variáveis independentes que influenciam significativamente a variável dependente. Isso é feito com computadores por meio de iteração, que é o processo de chegar a resultados ou decisões passando por repetidas rodadas ou ciclos de análise. A realização automática de testes com a ajuda de pacotes de software estatístico tem a vantagem de economizar tempo para o indivíduo.
Principais Takeaways
- A análise de regressão é uma abordagem estatística que busca entender e medir as relações entre variáveis independentes e dependentes. A regressão passo a passo é um método que examina a significância estatística de cada variável independente dentro do modelo.A abordagem de seleção direta adiciona uma variável e testa a significância estatística O método de eliminação para trás começa com um modelo carregado com muitas variáveis e, em seguida, remove uma variável para testar sua importância em relação aos resultados gerais. A regressão passo a passo tem muitos críticos, pois é uma abordagem que ajusta os dados em um modelo para alcançar o resultado desejado.
A regressão passo a passo pode ser alcançada testando uma variável independente por vez e incluindo-a no modelo de regressão se for estatisticamente significativa ou incluindo todas as possíveis variáveis independentes no modelo e eliminando aquelas que não são estatisticamente significativas. Alguns usam uma combinação de ambos os métodos e, portanto, existem três abordagens para a regressão gradual:
- A seleção direta começa sem variáveis no modelo, testa cada variável à medida que é adicionada ao modelo e mantém as que são consideradas estatisticamente mais significativas - repetindo o processo até que os resultados sejam ideais. A eliminação do retorno começa com um conjunto de variáveis independentes, excluir um de cada vez e testar para verificar se a variável removida é estatisticamente significativa. A eliminação bidirecional é uma combinação dos dois primeiros métodos que testam quais variáveis devem ser incluídas ou excluídas.
Um exemplo de regressão gradual usando o método de eliminação para trás seria uma tentativa de entender o uso de energia em uma fábrica usando variáveis como tempo de execução do equipamento, idade do equipamento, tamanho do pessoal, tamanho da equipe, temperaturas externas e época do ano. O modelo inclui todas as variáveis - então cada uma é removida, uma de cada vez, para determinar qual é menos estatisticamente significativa. No final, o modelo pode mostrar que a época do ano e as temperaturas são mais significativas, possivelmente sugerindo que o pico de consumo de energia na fábrica ocorre quando o uso do ar-condicionado é mais alto.
Limitações da regressão passo a passo
Atualmente, a análise de regressão, linear e multivariada, é amplamente utilizada no mundo dos investimentos. A idéia é muitas vezes encontrar padrões que existiam no passado e que também podem se repetir no futuro. Uma regressão linear simples, por exemplo, pode considerar as relações preço / lucro e retorno das ações ao longo de muitos anos para determinar se as ações com baixos índices P / L (variável independente) oferecem retornos mais altos (variável dependente). O problema dessa abordagem é que as condições do mercado geralmente mudam e os relacionamentos mantidos no passado não necessariamente se aplicam no presente ou no futuro.
Enquanto isso, o processo de regressão passo a passo tem muitos críticos e há até chamadas para parar de usar o método completamente. Os estatísticos observam várias desvantagens da abordagem, incluindo resultados incorretos, um viés inerente ao processo em si e a necessidade de poder computacional significativo para desenvolver modelos de regressão complexos por meio de iteração.
