La definición de la tabla de distribución normal

¿Qué es la distribución normal?

La fórmula de distribución normal se basa en dos parámetros simples, la media y la desviación estándar, que cuantifican las características de un conjunto de datos determinado.

Mientras que la media indica el valor «central» o promedio de todo el conjunto de datos, la desviación estándar indica la «dispersión» o variación de los puntos de datos alrededor de ese valor medio.

Conclusiones clave

  • La fórmula de distribución normal se basa en dos parámetros simples, la media y la desviación estándar, que cuantifican las características de un conjunto de datos determinado.
  • Para facilitar un método estándar uniforme para cálculos fáciles y aplicabilidad a problemas del mundo real, se introdujo la conversión estándar a valores Z, que forman parte de la tabla de distribución normal.
  • Las propiedades de una distribución normal incluyen: la curva normal es simétrica con respecto a la media; la media está en el medio y divide el área en dos mitades; el área total bajo la curva es igual a 1 para media=0 y desviación estándar=1; y la distribución está completamente descrita por su media y stddev.
  • Las tablas de distribución normal se utilizan en el comercio de valores para ayudar a identificar tendencias alcistas o bajistas, niveles de soporte o resistencia y otros indicadores técnicos.

Ejemplo de distribución normal

Considere los siguientes 2 conjuntos de datos:

  1. Conjunto de datos 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
  2. Conjunto de datos 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}

Para Dataset1, media = 10 y desviación estándar (stddev) = 0

Para Dataset2, media = 10 y desviación estándar (stddev) = 2,83

Tracemos estos valores para DataSet1:

Imagen de Sabrina Jiang © Investopedia 2020

Del mismo modo para DataSet2:

Imagen de Sabrina Jiang © Investopedia 2020

La línea horizontal roja en los dos gráficos anteriores indica el valor «promedio» o promedio de cada conjunto de datos (10 en ambos casos). Las flechas rosadas en el segundo gráfico indican la dispersión o variación de los valores de datos del valor medio. Esto está representado por un valor de desviación estándar de 2,83 en el caso de DataSet2. Dado que DataSet1 tiene todos los valores iguales (como 10 cada uno) y sin variaciones, el valor de stddev es cero y, por lo tanto, no se aplican flechas rosas.

El valor stddev tiene algunas características significativas y útiles que son extremadamente útiles en el análisis de datos. Para una distribución normal, los valores de los datos se distribuyen simétricamente a ambos lados de la media. Para cualquier conjunto de datos normalmente distribuido, trazando un gráfico con stddev en el eje horizontal y el número de valores de datos en el eje vertical, se obtiene el siguiente gráfico.

Imagen de Sabrina Jiang © Investopedia 2020

Propiedades de una distribución normal

  1. La curva normal es simétrica con respecto a la media;
  2. La media está en el medio y divide el área en dos mitades;
  3. El área total bajo la curva es igual a 1 para media=0 y desviación estándar=1;
  4. La distribución está completamente descrita por su media y stddev

Como se puede ver en el gráfico anterior, stddev representa lo siguiente:

  • 68,3% de los valores de datos están dentro 1 desviación estándar de la media (-1 a +1)
  • 95,4% de los valores de datos están dentro 2 desviaciones estándar de la media (-2 a +2)
  • 99,7% de los valores de datos están dentro 3 desviaciones estándar de la media (-3 a +3)

El área bajo la curva en forma de campana, cuando se mide, indica la probabilidad deseada de un rango dado:

  • menos que X: por ejemplo, probabilidad de que los valores de los datos sean inferiores a 70
  • mayor que X: por ejemplo, probabilidad de que los valores de los datos sean mayores que 95
  • entre X1 y X2: por ejemplo, probabilidad de valores de datos entre 65 y 85

donde X es un valor de interés (ejemplos a continuación).

Trazar y calcular el área no siempre es conveniente, ya que diferentes conjuntos de datos tendrán diferentes valores medios y estándar. Para facilitar un método estándar uniforme para cálculos fáciles y aplicabilidad a problemas del mundo real, se introdujo la conversión estándar a valores Z, que forman parte del Tabla de distribución normal.

Z = (X – media)/stddev, donde X es la variable aleatoria.

Básicamente, esta conversión obliga a que la media y la desviación estándar se estandaricen en 0 y 1 respectivamente, lo que permite un conjunto estándar definido de valores Z (del Tabla de distribución normal) para ser utilizado para cálculos fáciles. Una instantánea de la tabla estándar de valores z que contiene valores de probabilidad es la siguiente:

z

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.0

0.00000

0.00399

0.00798

0.01197

0.01595

0.01994

0.1

0.0398

0.04380

0.04776

0.05172

0.05567

0.05966

0.2

0.0793

0.08317

0.08706

0.09095

0.09483

0.09871

0.3

0.11791

0.12172

0.12552

0.12930

0.13307

0.13683

0.4

0.15542

0.15910

0.16276

0.16640

0.17003

0.17364

0.5

0.19146

0.19497

0.19847

0.20194

0.20540

0.20884

0.6

0.22575

0.22907

0.23237

0.23565

0.23891

0.24215

0.7

0.25804

0.26115

0.26424

0.26730

0.27035

0.27337

Para encontrar la probabilidad relacionada con el valor z de 0,239865, primero redondee a 2 decimales (es decir, 0,24). Luego verifique los primeros 2 dígitos significativos (0.2) en las filas y el dígito menos significativo (0.04 restante) en la columna. Eso conducirá a un valor de 0.09483.

La tabla de distribución normal completa, con una precisión de hasta 5 puntos decimales para los valores de probabilidad (incluidos los valores negativos), se puede encontrar aquí.

Veamos algunos ejemplos de la vida real. La altura de los individuos en un grupo grande sigue un patrón de distribución normal. Suponga que tenemos un conjunto de 100 individuos cuyas alturas se registran y la media y la desviación estándar se calculan en 66 y 6 pulgadas respectivamente.

Imagen de Sabrina Jiang © Investopedia 2020

Aquí hay algunas preguntas de muestra que se pueden responder fácilmente usando la tabla de valor z:

¿Cuál es la probabilidad de que una persona del grupo mida 70 pulgadas o menos?

La pregunta es encontrar valor acumulado de P(X<=70), es decir, en todo el conjunto de datos de 100, cuántos valores habrá entre 0 y 70.

Primero, convirtamos el valor X de 70 al valor Z equivalente.

Z = (X – media)/stddev = (70-66)/6 = 4/6 = 0,66667 = 0,67 (redondeado a 2 decimales)

Ahora necesitamos encontrar P (Z <= 0.67) = 0. 24857 (de la tabla z anterior)

es decir, hay un 24,857% de probabilidad de que un individuo del grupo mida menos o igual a 70 pulgadas.

Pero espera, lo anterior está incompleto. Recuerde, estamos buscando la probabilidad de todas las alturas posibles hasta 70, es decir, de 0 a 70. Lo anterior solo le da la porción de la media al valor deseado (es decir, 66 a 70). Necesitamos incluir la otra mitad, del 0 al 66, para llegar a la respuesta correcta.

Dado que 0 a 66 representa la mitad de la porción (es decir, un extremo a la mitad de la media), su probabilidad es simplemente 0,5.

Por lo tanto, la probabilidad correcta de que una persona mida 70 pulgadas o menos = 0,24857 + 0,5 = 0,74857 = 74.857%

Gráficamente (mediante el cálculo del área), estas son las dos regiones sumadas que representan la solución:

Imagen de Sabrina Jiang © Investopedia 2020

¿Cuál es la probabilidad de que una persona mida 75 pulgadas o más?

es decir, encontrar Acumulativo complementario P(X>=75).

Z = (X – media)/stddev = (75-66)/6 = 9/6 = 1,5

P (Z >=1.5) = 1- P (Z <= 1.5) = 1 – (0.5+0.43319) = 0.06681 = 6.681%

Imagen de Sabrina Jiang © Investopedia 2020

¿Cuál es la probabilidad de que una persona mida entre 52 y 67 pulgadas?

Encuentre P(52<=X<=67).

PAG(52<=X<=67) = PAG [(52-66)/6 <= Z <= (67-66)/6] = P(-2,33 <= Z <= 0,17)

= P(Z <= 0.17) –P(Z <= -0.233) = (0.5+0.56749) - (.40905) =

Imagen de Sabrina Jiang © Investopedia 2020

Esta tabla de distribución normal (y los valores z) comúnmente encuentra uso para cualquier cálculo de probabilidad sobre los movimientos de precios esperados en el mercado de valores para acciones e índices. Se utilizan en el comercio basado en rangos, identificando tendencias alcistas o bajistas, niveles de soporte o resistencia y otros indicadores técnicos basados ​​en conceptos de distribución normal de media y desviación estándar.

Deja un comentario