O que é correlação espúria
Nas estatísticas, uma correlação espúria, ou espúria, refere-se a uma conexão entre duas variáveis que parece causal, mas não é. Relacionamentos espúrios geralmente têm a aparência de uma variável que afeta outra. Essa correlação espúria geralmente é causada por um terceiro fator que não é aparente no momento do exame, às vezes chamado de fator de confusão.
Principais Takeaways
- Correlação espúria, ou espúria, ocorre quando dois fatores parecem casualmente relacionados, mas não são. A aparência de um relacionamento causal é geralmente devida a movimentos semelhantes em um gráfico, que acabam sendo coincidentes ou causados por um terceiro fator "confuso". geralmente pode ser causado por tamanhos de amostra pequenos ou pontos de extremidade arbitrários.
Como funciona a correlação espúria
Quando duas variáveis aleatórias se acompanham de perto em um gráfico, é fácil suspeitar de correlação ou uma relação entre os dois fatores, onde uma mudança afeta a outra. Deixando de lado a "causalidade", outro tópico, essa observação pode levar o leitor do gráfico a acreditar que o movimento da variável A está vinculado ao movimento da variável B ou vice-versa. mas às vezes, após um exame estatístico mais próximo, os movimentos alinhados são coincidentes ou causados por um terceiro fator que afeta os dois primeiros. Esta é uma correlação espúria. A pesquisa feita com amostras pequenas ou pontos finais arbitrários é uma particularidade suscetível à falsidade.
Exemplo de correlações espúrias
Não é muito desafiador descobrir correlações interessantes. Muitos acabarão sendo espúrios, no entanto. Para as espécies masculinas em Wall Street, duas correlações espúrias populares envolvem mulheres e esportes. Originada na década de 1920 é a teoria do comprimento da saia, que sustenta que o comprimento da saia e a direção do mercado de ações estão correlacionadas. Se o comprimento da saia for longo, isso significa que o mercado de ações está caindo; se eles são curtos, o mercado está subindo. Por volta do final de janeiro, fala-se do chamado indicador do Super Bowl, que sugere que uma vitória da equipe da AFC provavelmente significa que o mercado de ações cairá no próximo ano, enquanto uma vitória da equipe da NFC pressagia um aumento no mercado. Desde 1966, o indicador tem uma taxa de precisão de 80%. É uma conversa divertida, mas provavelmente não é algo que um consultor financeiro sério recomendaria como estratégia de investimento para os clientes.
Aqui estão mais alguns exemplos de correlações espúrias comuns:
- Afogamentos aumentam quando as vendas de sorvete aumentam. Pode parecer que o aumento nas vendas de sorvetes cause mais afogamentos, mas, na realidade, o aumento do calor pode fazer com que mais pessoas nadem e comprem mais sorvetes. Os executivos que dizem por favor e agradecem com mais frequência desfrutam de um melhor desempenho de compartilhamento. As pessoas que usam equipamentos de equipe do Oakland Raiders têm maior probabilidade de cometer crimes.
Como identificar correlações espúrias
Estatísticos e outros cientistas que analisam dados devem estar sempre atentos a relacionamentos espúrios. Existem vários métodos que eles usam, incluindo:
- Garantindo uma amostra representativa adequada. Obtenção de um tamanho de amostra adequado. Desconfie de pontos de extremidade arbitrários. Controlando o maior número possível de variáveis externas. Usando uma hipótese nula e verificando um valor p forte.
