O que é uma distribuição T?
A distribuição T, também conhecida como distribuição t de Student, é um tipo de distribuição de probabilidade semelhante à distribuição normal com a forma de sino, mas com caudas mais pesadas. As distribuições T têm uma chance maior de valores extremos do que as distribuições normais, daí as caudas mais gordas.
Principais Takeaways
- A distribuição T é uma distribuição de probabilidade contínua do escore z, quando o desvio padrão estimado é usado no denominador, e não o desvio padrão real. A distribuição T, como a distribuição normal, é em forma de sino e simétrica, mas é mais pesada. caudas, o que significa que tende a produzir valores que estão longe de sua média. Os testes T são usados em estatística para estimar a significância.
O que uma distribuição T diz a você?
O peso da cauda é determinado por um parâmetro da distribuição T chamado graus de liberdade, com valores menores dando caudas mais pesadas e com valores mais altos fazendo com que a distribuição T se assemelhe a uma distribuição normal padrão com média de 0 e desvio padrão de 1. A distribuição T também é conhecida como "Distribuição T do aluno".
A região azul ilustra um teste de hipótese bicaudal. CKTaylor
Quando uma amostra de n observações é retirada de uma população normalmente distribuída com média M e desvio padrão D, a média da amostra m eo desvio padrão da amostra d são diferentes de M e D devido à aleatoriedade da amostra.
Um escore z pode ser calculado com o desvio padrão da população como Z = (m - M) / {D / sqrt (n)}, e esse valor tem a distribuição normal com média 0 e desvio padrão 1. Mas quando esse z- A pontuação é calculada usando o desvio padrão estimado, dando T = (m - M) / {d / sqrt (n)}, a diferença entre d e D torna a distribuição uma distribuição T com (n - 1) graus de liberdade em vez de a distribuição normal com média 0 e desvio padrão 1.
Exemplo de como usar uma distribuição T
Veja o exemplo a seguir de como as distribuições t são usadas na análise estatística. Primeiro, lembre-se de que um intervalo de confiança para a média é um intervalo de valores, calculado a partir dos dados, destinado a capturar uma média de "população". Esse intervalo é m + - t * d / sqrt (n), onde t é um valor crítico da distribuição T.
Por exemplo, um intervalo de confiança de 95% para o retorno médio da Média Industrial Dow Jones nos 27 dias úteis anteriores a 11/9/2001 é de -0, 33%, (+/- 2, 055) * 1, 07 / sqrt (27), dando um retorno médio (persistente) como um número entre -0, 75% e + 0, 09%. O número 2.055, a quantidade de erros padrão a serem ajustados, é encontrado na distribuição T.
Como a distribuição T tem caudas mais gordas que a distribuição normal, ela pode ser usada como modelo para retornos financeiros que exibem excesso de curtose, o que permitirá um cálculo mais realista do Valor em Risco (VaR) nesses casos.
A diferença entre uma distribuição T e uma distribuição normal
Distribuições normais são usadas quando a distribuição da população é considerada normal. A distribuição T é semelhante à distribuição normal, apenas com caudas mais gordas. Ambos assumem uma população normalmente distribuída. As distribuições T têm curtose mais alta que as distribuições normais. A probabilidade de obter valores muito longe da média é maior com uma distribuição T do que com uma distribuição normal.
Limitações do uso de uma distribuição T
A distribuição T pode distorcer a exatidão em relação à distribuição normal. Sua deficiência só surge quando há necessidade de perfeita normalidade. No entanto, a diferença entre usar uma distribuição normal e T é relativamente pequena.
