Qu’est-ce qu’une distribution T ?
La distribution T, également connue sous le nom de distribution t de Student, est un type de distribution de probabilité similaire à la distribution normale avec sa forme en cloche, mais avec des queues plus lourdes. Les distributions T ont plus de chances de présenter des valeurs extrêmes que les distributions normales, d’où les queues plus grosses.
Points clés à retenir
- La distribution T est une distribution de probabilité continue du score z lorsque l’écart-type estimé est utilisé au dénominateur plutôt que l’écart-type réel.
- La distribution T, comme la distribution normale, est en forme de cloche et symétrique, mais elle a des queues plus lourdes, ce qui signifie qu’elle a tendance à produire des valeurs qui sont loin de sa moyenne.
- Les tests T sont utilisés en statistique pour estimer la signification.
Que vous dit une distribution T ?
La lourdeur de la queue est déterminée par un paramètre de la distribution T appelé degrés de liberté, les valeurs les plus faibles donnant des queues plus lourdes, et les valeurs les plus élevées faisant ressembler la distribution T à une distribution normale standard avec une moyenne de 0 et un écart-type de 1. La distribution T est également connue sous le nom de « distribution T de Student ».
Lorsqu’un échantillon de n observations est prélevé dans une population normalement distribuée ayant une moyenne M et un écart-type D, la moyenne de l’échantillon, m, et l’écart-type de l’échantillon, d, diffèrent de M et D en raison du caractère aléatoire de l’échantillon.
Un score z peut être calculé avec l’écart-type de la population comme Z = (x – M)/D, et cette valeur a la distribution normale avec une moyenne 0 et un écart-type 1. Mais lorsque l’on utilise l’écart type estimé, un t-score est calculé comme T = (m – M)/{d/sqrt(n)}, la différence entre d et D fait que la distribution est une distribution T avec (n – 1) degrés de liberté plutôt que la distribution normale avec la moyenne 0 et l’écart type 1.
Exemple d’utilisation d’une distribution en T
Prenez l’exemple suivant pour savoir comment les distributions t sont utilisées dans l’analyse statistique. Tout d’abord, n’oubliez pas qu’un intervalle de confiance pour la moyenne est une plage de valeurs, calculée à partir des données, destinée à saisir une moyenne de « population ». Cet intervalle est m +- t*d/sqrt(n), où t est une valeur critique de la distribution T.
Par exemple, un intervalle de confiance de 95 % pour le rendement moyen de l’indice Dow Jones des valeurs industrielles au cours des 27 jours de bourse précédant le 11 septembre 2001 est de -0,33 %, (+/- 2,055) * 1,07 / m²(27), ce qui donne un rendement moyen (persistant) compris entre -0,75 % et +0,09 %. Le nombre 2,055, qui correspond à la quantité d’erreurs types à corriger, est tiré de la distribution T.
Comme la distribution T a des queues plus grosses qu’une distribution normale, elle peut être utilisée comme modèle pour les rendements financiers qui présentent un excès de kurtosis, ce qui permettra un calcul plus réaliste de la valeur à risque (VaR) dans de tels cas.
La différence entre une distribution T et une distribution normale
Les distributions normales sont utilisées lorsque la distribution de la population est supposée être normale. La distribution T est similaire à la distribution normale, mais avec des queues plus grosses. Les deux supposent une population à distribution normale. Les distributions T ont une aplatissement plus élevé que les distributions normales. La probabilité d’obtenir des valeurs très éloignées de la moyenne est plus grande avec une distribution T qu’avec une distribution normale.
Limites de l’utilisation d’une distribution T
La distribution T peut être faussée par rapport à la distribution normale. Son défaut n’apparaît que lorsqu’il y a besoin d’une normalité parfaite. Cependant, la différence entre l’utilisation d’une distribution normale et d’une distribution T est relativement faible.