O que são estatísticas não paramétricas?
Estatísticas não paramétricas referem-se a um método estatístico no qual os dados não são necessários para ajustar uma distribuição normal. As estatísticas não paramétricas usam dados geralmente ordinais, o que significa que não se baseiam em números, mas em uma classificação ou ordem das sortes. Por exemplo, uma pesquisa com preferências do consumidor variando de gostar a não gostar seria considerada um dado ordinal.
A estatística não paramétrica inclui estatística descritiva não paramétrica, modelos estatísticos, inferência e testes estatísticos. A estrutura do modelo de modelos não paramétricos não é especificada a priori, mas é determinada a partir dos dados. O termo não paramétrico não pretende implicar que tais modelos carecem completamente de parâmetros, mas que o número e a natureza dos parâmetros são flexíveis e não são previamente fixados. Um histograma é um exemplo de uma estimativa não paramétrica de uma distribuição de probabilidade.
Noções básicas sobre estatísticas não paramétricas
Nas estatísticas, as estatísticas paramétricas incluem parâmetros como média, mediana, desvio padrão, variância etc. Esta forma de estatística usa os dados observados para estimar os parâmetros da distribuição. Sob estatísticas paramétricas, supõe-se que os dados correspondam a uma distribuição normal com parâmetros desconhecidos μ (média da população) e σ 2 (variação da população), que são então estimados usando a média da amostra e a variação da amostra.
Estatísticas não paramétricas não assumem o tamanho da amostra ou se os dados observados são quantitativos.
As estatísticas não paramétricas não pressupõem que os dados sejam extraídos de uma distribuição normal. Em vez disso, a forma da distribuição é estimada sob esta forma de medição estatística. Embora existam muitas situações em que uma distribuição normal possa ser assumida, também existem alguns cenários em que não será possível determinar se os dados serão normalmente distribuídos.
Exemplos de estatísticas não paramétricas
No primeiro exemplo, considere que um pesquisador que deseja uma estimativa do número de bebês na América do Norte nascidos com olhos castanhos pode decidir coletar uma amostra de 150.000 bebês e executar uma análise no conjunto de dados. A medida que eles derivam será usada como uma estimativa de toda a população de bebês com olhos castanhos nascidos no ano seguinte.
Para um segundo exemplo, considere um pesquisador diferente que queira saber se dormir cedo ou tarde está relacionado à frequência com que alguém adoece. Assumindo que a amostra é escolhida aleatoriamente na população, pode-se considerar normal a distribuição do tamanho da amostra da frequência da doença. No entanto, um experimento que mede a resistência do corpo humano a uma cepa de bactérias não pode ser considerado como tendo uma distribuição normal.
Isso ocorre porque dados de amostra selecionados aleatoriamente podem ser resistência à tensão. Por outro lado, se o pesquisador considerar fatores como composição genética e etnia, ele pode descobrir que um tamanho de amostra selecionado usando essas características pode não ser resistente à cepa. Portanto, não se pode assumir uma distribuição normal.
Este método é útil quando os dados não têm uma interpretação numérica clara e é melhor usá-los com dados que possuem uma classificação das sortes. Por exemplo, um teste de avaliação de personalidade pode ter uma classificação de suas métricas definida como discordo totalmente, discordo, indiferente, concordo e concordo totalmente. Nesse caso, métodos não paramétricos devem ser usados.
Considerações Especiais
Estatísticas não paramétricas ganharam valor devido à sua facilidade de uso. À medida que a necessidade de parâmetros é aliviada, os dados se tornam mais aplicáveis a uma variedade maior de testes. Esse tipo de estatística pode ser usado sem a média, tamanho da amostra, desvio padrão ou estimativa de quaisquer outros parâmetros relacionados quando nenhuma dessas informações estiver disponível.
Como as estatísticas não paramétricas fazem menos suposições sobre os dados de amostra, sua aplicação é de escopo mais amplo que as estatísticas paramétricas. Nos casos em que o teste paramétrico é mais apropriado, os métodos não paramétricos serão menos eficientes. Isso ocorre porque os resultados obtidos a partir de estatísticas não paramétricas têm um grau de confiança menor do que se os resultados fossem obtidos usando estatísticas paramétricas.
Principais Takeaways
- As estatísticas não paramétricas são fáceis de usar, mas não oferecem a precisão exata de outros modelos estatísticos. Esse tipo de análise é mais adequado quando se considera a ordem de algo, onde, mesmo que os dados numéricos sejam alterados, os resultados provavelmente permanecerão os mesmos.
