A fórmula de distribuição normal é baseada em dois parâmetros simples - média e desvio padrão - que quantificam as características de um determinado conjunto de dados. Enquanto a média indica o valor “central” ou médio de todo o conjunto de dados, o desvio padrão indica a “dispersão” ou variação dos pontos de dados em torno desse valor médio.
Considere os 2 conjuntos de dados a seguir:
Conjunto de dados 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Conjunto de dados 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Para o conjunto de dados1, média = 10 e desvio padrão (stddev) = 0
Para o conjunto de dados2, média = 10 e desvio padrão (stddev) = 2, 83
Vamos plotar esses valores para o DataSet1:
Da mesma forma para DataSet2:
A linha horizontal vermelha nos dois gráficos acima indica o valor "médio" ou médio de cada conjunto de dados (10 em ambos os casos). As setas cor de rosa no segundo gráfico indicam a dispersão ou variação dos valores dos dados a partir do valor médio. Isso é representado pelo valor do desvio padrão de 2, 83 no caso do DataSet2. Como o DataSet1 tem todos os valores iguais (10 cada) e nenhuma variação, o valor stddev é zero e, portanto, nenhuma seta rosa é aplicável.
O valor stddev possui algumas características significativas e úteis que são extremamente úteis na análise de dados. Para uma distribuição normal, os valores dos dados são distribuídos simetricamente em ambos os lados da média. Para qualquer conjunto de dados normalmente distribuído, plotar gráfico com stddev no eixo horizontal e não. dos valores dos dados no eixo vertical, é obtido o seguinte gráfico.
Propriedades de uma distribuição normal
- A curva normal é simétrica em relação à média; a média fica no meio e divide a área em duas metades; a área total sob a curva é igual a 1 para média = 0 e stdev = 1; a distribuição é completamente descrita por sua média e stddev
Como pode ser visto no gráfico acima, stddev representa o seguinte:
- 68, 3% dos valores dos dados estão dentro de 1 desvio padrão da média (-1 a +1) 95, 4% dos valores dos dados estão dentro de 2 desvios padrão da média (-2 a +2) 99, 7% dos valores dos dados estão dentro de 3 desvios padrão da média (-3 a +3)
A área sob a curva em forma de sino, quando medida, indica a probabilidade desejada de um determinado intervalo:
- menor que X: - por exemplo, probabilidade de valores de dados serem menores que 70 maiores que X - por exemplo, probabilidade de valores de dados serem maiores que 95 entre X 1 e X 2 - por exemplo, probabilidade de valores de dados entre 65 e 85
onde X é um valor de interesse (exemplos abaixo).
Plotar e calcular a área nem sempre é conveniente, pois conjuntos de dados diferentes terão valores médios e stddev diferentes. Para facilitar um método padrão uniforme para cálculos fáceis e aplicabilidade a problemas do mundo real, foi introduzida a conversão padrão em valores Z, que fazem parte da Tabela de Distribuição Normal.
Z = (X - média) / stddev, onde X é a variável aleatória.
Basicamente, essa conversão força a média e o stddev a serem padronizados para 0 e 1, respectivamente, o que permite que um conjunto definido padrão de valores Z (da Tabela de distribuição normal) seja usado para cálculos fáceis. Um instantâneo da tabela de valor-z padrão contendo valores de probabilidade é o seguinte:
z |
0, 00 |
0, 01 |
0, 02 |
0, 03 |
0, 04 |
0, 05 |
0, 06 |
0, 0 |
0, 00000 |
0, 00399 |
0, 00798 |
0, 01197 |
0, 01595 |
0, 01994 |
… |
0, 1 |
0, 0398 |
0, 04380 |
0, 04776 |
0, 05172 |
0, 05567 |
0, 05966 |
… |
0, 2 |
0, 0793 |
0, 08317 |
0, 08706 |
0, 09095 |
0, 09483 |
0, 09871 |
… |
0, 3 |
0, 11179 |
0, 12172 |
0, 12552 |
0, 12930 |
0, 13307 |
0, 13683 |
… |
0, 4 |
0, 15542 |
0, 15910 |
0, 16276 |
0, 16640 |
0, 17003 |
0, 17364 |
… |
0, 5 |
0, 19146 |
0, 19497 |
0, 19847 |
0.20194 |
0, 20540 |
0, 20884 |
… |
0, 6 |
0, 22575 |
0, 22907 |
0, 23237 |
0, 23565 |
0, 223891 |
0, 22415 |
… |
0, 7 |
0, 25804 |
0, 26115 |
0, 26424 |
0, 26730 |
0, 27035 |
0, 27337 |
… |
... |
… |
… |
… |
… |
… |
… |
… |
Para encontrar a probabilidade relacionada ao valor-z de 0, 239865, primeiro arredonde para 2 casas decimais (ou seja, 0, 24). Em seguida, verifique os 2 primeiros dígitos significativos (0, 2) nas linhas e o dígito menos significativo (restante 0, 04) na coluna. Isso levará ao valor de 0, 09483.
A tabela de distribuição normal completa, com precisão de até 5 casas decimais para valores de probabilidade (incluindo aqueles para valores negativos), pode ser encontrada aqui.
Vamos ver alguns exemplos da vida real. A altura dos indivíduos em um grande grupo segue um padrão de distribuição normal. Suponha que temos um conjunto de 100 indivíduos cujas alturas são registradas e a média e o stddev calculados para 66 e 6 polegadas, respectivamente.
Aqui estão alguns exemplos de perguntas que podem ser facilmente respondidas usando a tabela de valor z:
- Qual é a probabilidade de uma pessoa do grupo ter 70 polegadas ou menos?
A questão é encontrar o valor acumulado de P (X <= 70), ou seja, em todo o conjunto de dados de 100, quantos valores estarão entre 0 e 70.
Vamos primeiro converter o valor X de 70 para o valor Z equivalente.
Z = (X - média) / stddev = (70-66) / 6 = 4/6 = 0, 6667 = 0, 67 (arredondar para 2 casas decimais)
Agora precisamos encontrar P (Z <= 0, 67) = 0. 24857 (da tabela z acima)
ou seja, há uma probabilidade de 24, 857% de que um indivíduo no grupo seja menor ou igual a 70 polegadas.
Mas espere - o acima está incompleto. Lembre-se, estamos procurando a probabilidade de todas as alturas possíveis até 70, ou seja, de 0 a 70. O exemplo acima apenas fornece a parte do valor médio ao valor desejado (ou seja, 66 a 70). Precisamos incluir a outra metade - de 0 a 66 - para chegar à resposta correta.
Como 0 a 66 representa a metade da porção (ou seja, uma média extrema a intermediária), sua probabilidade é simplesmente 0, 5.
Daí a probabilidade correta de uma pessoa ter 70 polegadas ou menos = 0, 24857 + 0, 5 = 0, 44857 = 74, 857%
Graficamente (calculando a área), estas são as duas regiões somadas que representam a solução:
- Qual é a probabilidade de uma pessoa ter 75 polegadas ou mais?
ou seja, encontre P cumulativo complementar (X> = 75).
Z = (X - média) / stddev = (75-66) / 6 = 9/6 = 1, 5
P (Z> = 1, 5) = 1- P (Z <= 1, 5) = 1 - (0, 5 + 0, 43319) = 0, 06681 = 6, 681%
- Qual é a probabilidade de uma pessoa estar entre 52 polegadas e 67 polegadas?
Encontre P (52 <= X <= 67).
P (52 <= X <= 67) = P = P (-2, 33 <= Z <= 0, 17)
= P (Z <= 0, 17) –P (Z <= -0, 233) = (0, 5 + 0, 56749) - (0, 40905) =
Essa tabela de distribuição normal (e valores-z) costuma ser usada para qualquer cálculo de probabilidade dos movimentos de preços esperados no mercado de ações para ações e índices. Eles são usados na negociação baseada em faixa, identificando níveis de tendência de alta ou baixa, suporte ou resistência e outros indicadores técnicos baseados em conceitos normais de distribuição de média e desvio padrão.
Comparar contas de investimento × As ofertas que aparecem nesta tabela são de parcerias das quais a Investopedia recebe remuneração. Nome do provedor DescriçãoArtigos relacionados
Negociação Educação Básica
Teste de hipóteses em finanças: conceito e exemplos
Gerenciamento de riscos
Otimize seu portfólio usando a distribuição normal
Análise Técnica Educação Básica
A regressão linear de tempo e preço
Gerenciamento de riscos
Os usos e limites da volatilidade
Analise financeira
Como calcular o valor em risco (VaR) no Excel
Ferramentas para Análise Fundamental
Noções básicas sobre medidas de volatilidade
Links de parceirosTermos relacionados
Definição de intervalo de confiança O intervalo de confiança, nas estatísticas, refere-se à probabilidade de um parâmetro populacional cair entre dois valores definidos. mais Gerenciamento de riscos nas finanças No mundo financeiro, o gerenciamento de riscos é o processo de identificação, análise e aceitação ou mitigação da incerteza nas decisões de investimento. O gerenciamento de riscos ocorre sempre que um investidor ou administrador de fundos analisa e tenta quantificar o potencial de perdas em um investimento. mais Entendendo a curva de tesouraria de taxa spot A curva de tesouraria de taxa spot é definida como uma curva de rentabilidade construída usando taxas spot de tesouraria em vez de rendimentos. A curva de tesouraria à taxa spot pode ser usada como referência para precificação de títulos. mais Definição do índice de Gini O índice de Gini é uma medida estatística de distribuição frequentemente usada como um indicador da desigualdade econômica. mais Modelo de precificação de ativos de capital (CAPM) O modelo de precificação de ativos de capital é um modelo que descreve a relação entre risco e retorno esperado. mais Entendendo a média harmônica A média harmônica é uma média que é usada nas finanças para calcular médias médias como a relação preço-lucro. Mais