O que é um erro de não amostragem?
Um erro de não amostragem é um termo estatístico que se refere a um erro resultante durante a coleta de dados, fazendo com que os dados sejam diferentes dos valores reais. Um erro de não amostragem difere de um erro de amostragem. Um erro de amostragem é limitado a quaisquer diferenças entre os valores da amostra e os valores do universo que surgem porque o tamanho da amostra foi limitado. (O universo inteiro não pode ser amostrado em uma pesquisa ou um censo.)
Principais Takeaways
- Um erro de não amostragem é um termo usado nas estatísticas que se refere a um erro que ocorre durante a coleta de dados, fazendo com que os dados sejam diferentes dos valores reais. Um erro de não amostragem refere-se a erros aleatórios ou sistemáticos, e esses erros podem ser difíceis de detectar em uma pesquisa, amostra ou censo. Os erros sistemáticos de não amostragem são piores do que os erros aleatórios de não amostragem, porque erros sistemáticos podem resultar na remoção do estudo, pesquisa ou censo. Quanto maior o número de erros, menor a confiabilidade das informações. Quando ocorrem erros de não amostragem, a taxa de viés em um estudo ou pesquisa aumenta.
Um erro de amostragem pode ocorrer mesmo quando nenhum erro for cometido. Os "erros" resultam do simples fato de que é improvável que os dados em uma amostra correspondam perfeitamente aos dados no universo do qual a amostra é coletada. Este "erro" pode ser minimizado aumentando o tamanho da amostra.
Os erros de não amostragem cobrem todas as outras discrepâncias, incluindo aquelas que surgem de uma técnica de amostragem ruim.
Como funciona um erro de não amostragem
Erros de não amostragem podem estar presentes nas amostras e nos censos nos quais uma população inteira é pesquisada. Os erros de não amostragem se enquadram em duas categorias: aleatória e sistemática.
Acredita-se que erros aleatórios se compensem e, portanto, na maioria das vezes, são de pouca preocupação. Os erros sistemáticos, por outro lado, afetam toda a amostra e, portanto, apresentam uma questão mais significativa. Erros aleatórios, geralmente, não resultam em sucateamento de uma amostra ou de um censo, enquanto um erro sistemático provavelmente tornará os dados coletados inutilizáveis.
Os erros de não amostragem são causados por fatores externos e não por um problema de uma pesquisa, estudo ou censo.
Existem várias maneiras de ocorrer erros de não amostragem. Por exemplo, erros de não amostragem podem incluir, entre outros, erros de entrada de dados, perguntas de pesquisa tendenciosas, processamento / tomada de decisão tendenciosa, não respostas, conclusões de análises inadequadas e informações falsas fornecidas pelos entrevistados.
Considerações Especiais
Embora o aumento do tamanho da amostra possa ajudar a minimizar os erros de amostragem, ele não terá nenhum efeito na redução de erros de não amostragem. Isso ocorre porque os erros de não amostragem costumam ser difíceis de detectar e é praticamente impossível eliminá-los.
Os erros de não amostragem incluem erros de não resposta, erros de cobertura, erros de entrevista e erros de processamento. Um erro de cobertura ocorreria, por exemplo, se uma pessoa fosse contada duas vezes em uma pesquisa ou suas respostas fossem duplicadas na pesquisa. Se um entrevistador é enviesado na amostragem, o erro de não amostragem seria considerado um erro do entrevistador.
Além disso, é difícil provar que os entrevistados em uma pesquisa estão fornecendo informações falsas - por engano ou de propósito. De qualquer forma, as informações incorretas fornecidas pelos entrevistados contam como erros de não amostragem e são descritas como erros de resposta.
Os erros técnicos existem em uma categoria diferente. Se houver alguma entrada relacionada a dados - como codificação, coleção, entrada ou edição - elas serão consideradas erros de processamento.
