O que é o Winsorized Mean?
A média Winsorized é um método de calcular a média que substitui inicialmente os menores e os maiores valores pelas observações mais próximas. Isso é feito para limitar o efeito de valores extremos anormais, ou outliers, no cálculo. Após a substituição dos valores, a fórmula da média aritmética é então usada para calcular a média winorized.
A fórmula para a média Winsorized É
O que outras pessoas estão dizendo Média Wororizada = Nxn… xn + 1 + xn + 2… xn em que: n = O número de pontos de dados maiores e menores a serem substituídos pela observação
Os meios Winsorized são expressos de duas maneiras. Uma média "k n " winorized refere-se à substituição da menor e da maior 'k' observações, onde 'k' é um número inteiro. Uma média "X%" winorized envolve a substituição de uma determinada porcentagem de valores de ambas as extremidades dos dados.
Como calcular a média Winsorized
A média winorized é calculada substituindo os pontos de dados menores e maiores, somando todos os pontos de dados e dividindo a soma pelo número total de pontos de dados.
O que o Winsorized significa dizer?
A média winorized é menos sensível aos valores discrepantes porque pode substituí-los por valores menos extremos. Ou seja, é menos suscetível a contornos versus a média. No entanto, se uma distribuição tiver caudas gordas, o efeito de remover os valores mais altos e mais baixos na distribuição terá pouca influência devido ao alto número de variabilidade nos números de distribuição.
Principais Takeaways
- Um método de média que inclui substituir os menores e os maiores valores pelas observações mais próximas. Menos sensíveis aos outliers porque podem substituí-los por valores menos extremos. É diferente da média aparada, que envolve a remoção de pontos de dados - embora o resultado dos dois tendem a estar perto.
Exemplo de como usar a média Winsorized
Pode-se calcular a média winorized para o seguinte conjunto de dados: 1, 5, 7, 8, 9, 10, 14. Neste exemplo, assumimos que a média winorized está na primeira ordem, substituímos os valores menores e maiores pelos respectivos observações mais próximas.
O conjunto de dados agora aparece da seguinte forma: 5, 5, 7, 8, 9, 10, 10. A média aritmética do novo conjunto produz uma média winorized de 7, 7 ou (5 + 5 + 7 + 8 + 9 + 10 + 10) dividido por 7.
Ou considere uma média de 20% com vitórias superiores a 10% e 10% inferiores e substituindo-as pelo próximo valor mais próximo. Vamos ganhar o seguinte conjunto de dados: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Os dois os menores e maiores pontos de dados, ou 10%, serão substituídos pelo próximo valor mais próximo. Assim, o novo conjunto de dados é: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. O winsorized a média é 33, 9 ou o total dos dados (678) dividido pelo número total de pontos de dados (20).
A diferença entre média Worsorized e média aparada
A média winorized inclui a modificação de pontos de dados, enquanto a média aparada envolve a remoção de pontos de dados. É comum que a média vitimizada e a média aparada estejam próximas.
Limitações do uso de média Winsorized
Uma grande desvantagem para os meios com vitórias é que eles introduzem viés no conjunto de dados. Concedido, o conjunto de dados é idealmente menos tendencioso após a modificação do que se houvesse discrepâncias.
Saiba mais sobre a média Winsorized
Para informações relacionadas, sobre as diferenças entre os principais cálculos de média.
