La définition de la table de distribution normale

Quelle est la distribution normale ?

La formule de distribution normale est basée sur deux paramètres simples – la moyenne et l’écart-type – qui quantifient les caractéristiques d’un ensemble de données donné. Alors que la moyenne indique la valeur « centrale » ou moyenne de l’ensemble des données, l’écart-type indique la « dispersion » ou la variation des points de données autour de cette valeur moyenne.

Exemple

Considérez les 2 ensembles de données suivants :

  1. Ensemble de données 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
  2. Ensemble de données 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}

Pour l’ensemble de données 1, la moyenne = 10 et l’écart-type (stddev) = 0

Pour l’ensemble de données 2, la moyenne = 10 et l’écart-type (stddev) = 2,83

Traçons ces valeurs pour le DataSet1 :

Data set 1

De même pour le DataSet2 :

Data set 2

La ligne horizontale rouge dans les deux graphiques ci-dessus indique la « moyenne » ou la valeur moyenne de chaque ensemble de données (10 dans les deux cas). Les flèches roses dans le deuxième graphique indiquent l’écart ou la variation des valeurs des données par rapport à la valeur moyenne. Ceci est représenté par une valeur d’écart type de 2,83 dans le cas du DataSet2. Comme le DataSet1 a toutes les mêmes valeurs (10 dans chaque cas) et aucune variation, la valeur de l’écart-type est de zéro, et donc aucune flèche rose n’est applicable.

La valeur stddev présente quelques caractéristiques significatives et utiles qui sont extrêmement utiles pour l’analyse des données. Pour une distribution normale, les valeurs des données sont distribuées symétriquement de part et d’autre de la moyenne. Pour tout ensemble de données normalement distribué, en traçant un graphique avec stddev sur l’axe horizontal et le nombre de valeurs de données sur l’axe vertical, on obtient le graphique suivant.

3

Propriétés d’une distribution normale

  1. La courbe normale est symétrique par rapport à la moyenne ;
  2. La moyenne se situe au milieu et divise la zone en deux moitiés ;
  3. L’aire totale sous la courbe est égale à 1 pour mean=0 et stdev=1 ;
  4. La distribution est complètement décrite par sa moyenne et stddev

Comme le montre le graphique ci-dessus, stddev représente ce qui suit :

  • 68,3 % des valeurs des données se situent à moins d’un écart-type de la moyenne (-1 à +1)
  • 95,4% des valeurs des données se situent à moins de 2 écarts types de la moyenne (-2 à +2)
  • 99,7 % des valeurs des données se situent à moins de 3 écarts types de la moyenne (-3 à +3)

L’aire sous la courbe en forme de cloche, lorsqu’elle est mesurée, indique la probabilité souhaitée pour une plage donnée :

  • moins de X : – par exemple, probabilité que les valeurs des données soient inférieures à 70
  • supérieur à X – par exemple, probabilité que les valeurs des données soient supérieures à 95
  • entre X1 et X2 – par exemple, probabilité des valeurs des données entre 65 et 85

où X est une valeur d’intérêt (exemples ci-dessous).

Le tracé et le calcul de la zone ne sont pas toujours pratiques, car les différents ensembles de données auront des valeurs moyennes et stddev différentes. Pour faciliter l’application d’une méthode standard uniforme permettant des calculs aisés et l’applicabilité à des problèmes réels, la conversion standard en valeurs Z a été introduite, qui font partie de la table de distribution normale.

Z = (X – moyenne)/stddev, où X est la variable aléatoire.

Fondamentalement, cette conversion oblige à normaliser la moyenne et le stddev à 0 et 1 respectivement, ce qui permet d’utiliser un ensemble standard de valeurs Z définies (provenant de la table de distribution normale) pour des calculs faciles. Voici un instantané de la table standard des valeurs Z contenant les valeurs de probabilité :

z

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.0

0.00000

0.00399

0.00798

0.01197

0.01595

0.01994

0.1

0.0398

0.04380

0.04776

0.05172

0.05567

0.05966

0.2

0.0793

0.08317

0.08706

0.09095

0.09483

0.09871

0.3

0.11791

0.12172

0.12552

0.12930

0.13307

0.13683

0.4

0.15542

0.15910

0.16276

0.16640

0.17003

0.17364

0.5

0.19146

0.19497

0.19847

0.20194

0.20540

0.20884

0.6

0.22575

0.22907

0.23237

0.23565

0.23891

0.24215

0.7

0.25804

0.26115

0.26424

0.26730

0.27035

0.27337

Pour trouver la probabilité liée à la valeur z de 0,239865, il faut d’abord l’arrondir à 2 décimales (c’est-à-dire 0,24). Vérifiez ensuite les 2 premiers chiffres significatifs (0,2) dans les lignes et le chiffre le moins significatif (0,04 restant) dans la colonne. Cela donnera une valeur de 0,09483.

Le tableau complet de la distribution normale, avec une précision allant jusqu’à 5 points décimaux pour les valeurs de probabilité (y compris les valeurs négatives), peut être trouvé ici.

Voyons quelques exemples concrets. La taille des individus dans un grand groupe suit un schéma de distribution normal. Supposons que nous ayons un ensemble de 100 individus dont la taille est enregistrée et que la moyenne et la stddev soient calculées à 66 et 6 pouces respectivement.

4

Voici quelques exemples de questions auxquelles on peut facilement répondre à l’aide du tableau de la valeur z :

  • Quelle est la probabilité qu’une personne du groupe soit de 70 pouces ou moins ?

La question est de trouver la valeur cumulative de P(X<=70) i.e. in the entire dataset of 100, how many values will be between 0 and 70.

Commençons par convertir la valeur X de 70 en valeur Z équivalente.

Z = (X – moyenne)/stddev = (70-66)/6 = 4/6 = 0,66667 = 0,67 (arrondi à 2 décimales)

Nous devons maintenant trouver P (Z <= 0.67) = 0. 24857 (from the z-table above)

c’est-à-dire qu’il y a une probabilité de 24,857 % qu’un individu du groupe soit inférieur ou égal à 70 pouces.

Mais attendez – ce qui précède est incomplet. N’oubliez pas que nous recherchons la probabilité de toutes les hauteurs possibles jusqu’à 70, c’est-à-dire de 0 à 70. Ce qui précède ne vous donne que la portion de la moyenne à la valeur souhaitée (c’est-à-dire de 66 à 70). Nous devons inclure l’autre moitié – de 0 à 66 – pour arriver à la bonne réponse.

Étant donné que 0 à 66 représente la moitié (c’est-à-dire une moyenne extrême à moyenne), sa probabilité est simplement de 0,5.

D’où la probabilité correcte qu’une personne soit de 70 pouces ou moins = 0,24857 + 0,5 = 0. 74857 = 74,857%.

Graphiquement (en calculant la superficie), ce sont les deux régions additionnées qui représentent la solution :

5

  • Quelle est la probabilité qu’une personne mesure 75 pouces ou plus ?

i.e. Trouver un P complémentaire cumulé (X>=75).

Z = (X – moyenne)/stddev = (75-66)/6 = 9/6 = 1,5

P (Z >=1,5) = 1- P (Z <= 1.5) = 1 – (0.5+0.43319) = 0.06681 = 6.681%

6

  • Quelle est la probabilité qu’une personne soit entre 52 pouces et 67 pouces ?

Trouver P(52<=X<=67).

P(52<=X<=67) = P [(52-66)/6 <= Z <= (67-66)/6] = P(-2.33 <= Z <= 0.17)

= P(Z <= 0.17) –P(Z <= -0.233) = (0.5+0.56749) - (.40905) =

Image 7

Cette table de distribution normale (et les valeurs z) est couramment utilisée pour tout calcul de probabilité sur les mouvements de prix attendus sur le marché boursier pour les actions et les indices. Elles sont utilisées dans les opérations de bourse basées sur la fourchette, pour identifier les tendances à la hausse ou à la baisse, les niveaux de soutien ou de résistance, et d’autres indicateurs techniques basés sur les concepts de distribution normale de la moyenne et de l’écart-type.

Retour haut de page