Qu’est-ce qu’un test T ?
Un test t est un type de statistique inférentielle utilisé pour déterminer s’il existe une différence significative entre les moyennes de deux groupes, qui peuvent être liés par certaines caractéristiques. Il est principalement utilisé lorsque les ensembles de données, comme l’ensemble de données enregistré comme le résultat d’un tirage à pile ou face de 100 fois, suivraient une distribution normale et peuvent présenter des écarts inconnus. Un test t est utilisé comme outil de test d’hypothèse, qui permet de vérifier une hypothèse applicable à une population.
Un test t examine la statistique t, les valeurs de la distribution t et les degrés de liberté pour déterminer la signification statistique. Pour effectuer un test avec trois moyennes ou plus, il faut utiliser une analyse de la variance.
1:38
Explication du T-Test
Essentiellement, un test t nous permet de comparer les valeurs moyennes des deux ensembles de données et de déterminer si elles proviennent de la même population. Dans les exemples ci-dessus, si nous devions prendre un échantillon d’élèves de la classe A et un autre échantillon d’élèves de la classe B, nous ne nous attendrions pas à ce qu’ils aient exactement la même moyenne et le même écart-type. De même, les échantillons prélevés dans le groupe témoin nourri au placebo et ceux prélevés dans le groupe sous traitement médicamenteux devraient avoir une moyenne et un écart-type légèrement différents.
Mathématiquement, le test t prend un échantillon de chacun des deux ensembles et établit l’énoncé du problème en supposant une hypothèse nulle que les deux moyennes sont égales. Sur la base des formules applicables, certaines valeurs sont calculées et comparées aux valeurs standard, et l’hypothèse nulle supposée est acceptée ou rejetée en conséquence.
Si l’hypothèse nulle peut être rejetée, cela indique que les données sont solides et ne sont probablement pas dues au hasard. Le test t n’est que l’un des nombreux tests utilisés à cette fin. Les statisticiens doivent en outre utiliser des tests autres que le test t pour examiner davantage de variables et des tests avec des échantillons plus importants. Pour un échantillon de grande taille, les statisticiens utilisent un test z. Parmi les autres tests possibles, on peut citer le test du chi carré et le test f.
Il existe trois types de tests t et ils sont classés en deux catégories : les tests t dépendants et les tests t indépendants.
Points clés à retenir
- Un test t est un type de statistique inférentielle utilisé pour déterminer s’il existe une différence significative entre les moyennes de deux groupes, qui peuvent être liés par certaines caractéristiques.
- Le test t est l’un des nombreux tests utilisés pour vérifier les hypothèses en statistique.
- Le calcul d’un test t nécessite trois valeurs de données clés. Elles comprennent la différence entre les valeurs moyennes de chaque ensemble de données (appelée différence moyenne), l’écart-type de chaque groupe et le nombre de valeurs de données de chaque groupe.
- Il existe plusieurs types de test t différents qui peuvent être effectués en fonction des données et du type d’analyse requis.
Résultats de tests ambigus
Imaginons qu’un fabricant de médicaments veuille tester un médicament nouvellement inventé. Il suit la procédure standard qui consiste à essayer le médicament sur un groupe de patients et à donner un placebo à un autre groupe, appelé groupe de contrôle. Le placebo donné au groupe de contrôle est une substance sans valeur thérapeutique escomptée et sert de référence pour mesurer la réaction de l’autre groupe, qui reçoit le médicament en question.
Après l’essai du médicament, les membres du groupe témoin nourri au placebo ont signalé une augmentation de l’espérance de vie moyenne de trois ans, tandis que les membres du groupe à qui le nouveau médicament est prescrit ont signalé une augmentation de l’espérance de vie moyenne de quatre ans. L’observation instantanée peut indiquer que le médicament est effectivement efficace, car les résultats sont meilleurs pour le groupe utilisant le médicament. Cependant, il est également possible que l’observation soit due à un événement fortuit, en particulier à un coup de chance surprenant. Un test t est utile pour conclure si les résultats sont effectivement corrects et applicables à l’ensemble de la population.
Dans une école, 100 élèves de la classe A ont obtenu une moyenne de 85 % avec un écart-type de 3 %. Cent autres élèves de la classe B ont obtenu une moyenne de 87 % avec un écart-type de 4 %. Bien que la moyenne de la classe B soit meilleure que celle de la classe A, il n’est peut-être pas correct de conclure que les performances globales des élèves de la classe B sont meilleures que celles des élèves de la classe A. Cela est dû au fait qu’il existe une variabilité naturelle des résultats aux tests dans les deux classes, de sorte que la différence pourrait être due au seul hasard. Un test t peut aider à déterminer si une classe a obtenu de meilleurs résultats que l’autre.
Hypothèses du test T
- La première hypothèse faite concernant les tests t concerne l’échelle de mesure. L’hypothèse d’un test t est que l’échelle de mesure appliquée aux données collectées suit une échelle continue ou ordinale, comme les scores d’un test de QI.
- La deuxième hypothèse est celle d’un échantillon aléatoire simple, selon laquelle les données sont collectées auprès d’une partie représentative et choisie au hasard de la population totale.
- La troisième hypothèse est que les données, lorsqu’elles sont tracées, donnent une courbe de distribution normale, en forme de cloche.
- La dernière hypothèse est l’homogénéité de la variance. Une variance homogène, ou égale, existe lorsque les écarts-types des échantillons sont approximativement égaux.
Calcul des tests T
Le calcul d’un test t nécessite trois valeurs de données clés. Elles comprennent la différence entre les valeurs moyennes de chaque ensemble de données (appelée différence moyenne), l’écart-type de chaque groupe et le nombre de valeurs de données de chaque groupe.
Le résultat du test t produit la valeur t. Cette valeur t calculée est ensuite comparée à une valeur obtenue à partir d’un tableau de valeurs critiques (appelé tableau de distribution T
). Cette comparaison permet de déterminer l’effet du hasard seul sur la différence, et si la différence se situe en dehors de cette plage de hasard. Le test t permet de savoir si la différence entre les groupes représente une véritable différence dans l’étude ou s’il s’agit éventuellement d’une différence aléatoire sans signification.
Tableaux de distribution T
Le tableau de distribution T est disponible en format à une queue et à deux queues. Le premier est utilisé pour évaluer les cas qui ont une valeur fixe ou une fourchette avec une direction claire (positive ou négative). Par exemple, quelle est la probabilité que la valeur de sortie reste inférieure à -3, ou qu’elle soit supérieure à sept lorsque l’on lance une paire de dés ? Cette dernière est utilisée pour l’analyse de la gamme, par exemple pour demander si les coordonnées se situent entre -2 et +2.
Les calculs peuvent être effectués à l’aide de logiciels standard qui prennent en charge les fonctions statistiques nécessaires, comme ceux que l’on trouve dans MS Excel.
Valeurs T et degrés de liberté
Le test t produit deux valeurs comme résultat : la valeur t et les degrés de liberté. La valeur t est un rapport entre la différence entre la moyenne des deux ensembles d’échantillons et la variation qui existe au sein des ensembles d’échantillons. Alors que la valeur du numérateur (la différence entre la moyenne des deux échantillons) est simple à calculer, le dénominateur (la variation qui existe au sein des échantillons) peut devenir un peu plus compliqué selon le type de valeurs de données concernées. Le dénominateur du rapport est une mesure de la dispersion ou de la variabilité. Des valeurs plus élevées de la valeur t, également appelée t-score, indiquent qu’une grande différence existe entre les deux ensembles d’échantillons. Plus la valeur t est faible, plus il y a de similitudes entre les deux échantillons.
- Un grand t-score indique que les groupes sont différents.
- Un petit t-score indique que les groupes sont similaires.
Les degrés de liberté font référence aux valeurs d’une étude qui ont la liberté de varier et sont essentiels pour évaluer l’importance et la validité de l’hypothèse nulle. Le calcul de ces valeurs dépend généralement du nombre d’enregistrements de données disponibles dans l’ensemble de l’échantillon.
Test T corrélé (ou apparié)
Le test t corrélé est effectué lorsque les échantillons sont généralement constitués de paires appariées d’unités similaires, ou lorsqu’il y a des cas de mesures répétées. Par exemple, il peut y avoir des cas où les mêmes patients sont testés de manière répétée – avant et après avoir reçu un traitement particulier. Dans de tels cas, chaque patient est utilisé comme échantillon témoin contre lui-même.
Cette méthode s’applique également aux cas où les échantillons sont liés d’une manière ou d’une autre ou présentent des caractéristiques correspondantes, comme une analyse comparative impliquant des enfants, des parents ou des frères et sœurs. Les tests t corrélés ou appariés sont de type dépendant, car ils concernent des cas où les deux séries d’échantillons sont liées.
La formule de calcul de la valeur t et des degrés de liberté pour un test t jumelé est la suivante
T= (n)
s(diff
) mean1-mean2 où : mean1 et mean2=Lesvaleurs moyennes de chacun des ensembles d’échantillons s(diff)=L’écart-type des différences des valeurs des données appariées n=Lataille de l’échantillon (le nombre de différences appariées)
Les deux autres types appartiennent aux tests t indépendants. Les échantillons de ces types sont sélectionnés indépendamment les uns des autres, c’est-à-dire que les ensembles de données dans les deux groupes ne se réfèrent pas aux mêmes valeurs. Ils comprennent des cas comme un groupe de 100 patients qui est divisé en deux ensembles de 50 patients chacun. L’un des groupes devient le groupe de contrôle et reçoit un placebo, tandis que l’autre groupe reçoit le traitement prescrit. Il s’agit de deux groupes d’échantillons indépendants qui ne sont pas appariés l’un à l’autre.
Test T d’égalité de variance (ou de mise en commun)
Le test t de variance égale est utilisé lorsque le nombre d’échantillons dans chaque groupe est le même, ou lorsque la variance des deux ensembles de données est similaire. La formule suivante est utilisée pour calculer la valeur t et les degrés de liberté pour le test t de variance égale :
Valeur T=n1n2−2(n1−1)×var12(n2−1)×var22×n11n21mean1−mean2
et,
d’
Degrés de liberté=n1+n2-2 où : n1 et n2=Nombred’enregistrements dans chaque ensemble d’échantillons
Test T de variance inégale
Le test t de variance inégale est utilisé lorsque le nombre d’échantillons dans chaque groupe est différent, et que la variance des deux ensembles de données est également différente. Ce test est également appelé le test t de Welch. La formule suivante est utilisée pour calculer la valeur t et les degrés de liberté pour un test t de variance inégale :
de
de
d’échantillons
d’
1 }
end{aligned}
T-value= n1var12 + n2 var22 xml-ph-0863@deepl.inte mean1-mean2 où : mean1 et mean2=Valeurs moyennesdechaque desensembles d’échantillonsxml-ph-0863@deepl.inte
et,
Degrés de liberté= n1-1 ( n1 var12 )2 + n2-1 ( n2 var22 )2xml-ph- var1 et var2=Variancede chacun des ensembles d’échantillons n1 et n2=Nombred’enregistrements dans chaque ensemble d’échantillons
Déterminer le bon test T à utiliser
L’organigramme suivant peut être utilisé pour déterminer quel test t doit être utilisé en fonction des caractéristiques des ensembles d’échantillons. Les éléments clés à prendre en compte sont notamment la similarité des enregistrements de l’échantillon, le nombre d’enregistrements de données dans chaque ensemble d’échantillons et la variance de chaque ensemble d’échantillons.
Exemple de test T d’écart inégal
Supposons que nous prenions une mesure diagonale des peintures reçues dans une galerie d’art. Un groupe d’échantillons comprend 10 peintures, tandis que l’autre en comprend 20. Les ensembles de données, avec les valeurs moyennes et de variance correspondantes, sont les suivants :
Ensemble 1 | Ensemble 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
Moyenne | 19.4 | 21.6 |
Écart | 1.4 | 17.1 |
Bien que la moyenne de l’ensemble 2 soit supérieure à celle de l’ensemble 1, nous ne pouvons pas conclure que la population correspondant à l’ensemble 2 a une moyenne plus élevée que la population correspondant à l’ensemble 1. La différence de 19,4 à 21,6 est-elle due au seul hasard, ou existe-t-il réellement des différences dans la population globale de toutes les peintures reçues dans la galerie d’art ? Nous établissons le problème en supposant l’hypothèse nulle que la moyenne est la même entre les deux ensembles d’échantillons et nous effectuons un test t pour vérifier si l’hypothèse est plausible.
Étant donné que le nombre d’enregistrements de données est différent (n1 = 10 et n2 = 20) et que la variance est également différente, la valeur t et les degrés de liberté sont calculés pour l’ensemble de données ci-dessus en utilisant la formule mentionnée dans la section Test T de variance inégale.
La valeur t est de -2,24787. Comme le signe moins peut être ignoré lors de la comparaison des deux valeurs t, la valeur calculée est de 2,24787.
La valeur des degrés de liberté est de 24,38 et est réduite à 24, en raison de la définition de la formule qui exige d’arrondir la valeur à la valeur entière la plus faible possible.
On peut spécifier un niveau de probabilité (niveau alpha, niveau de signification, p) comme critère d’acceptation. Dans la plupart des cas, une valeur de 5 % peut être retenue.
En utilisant la valeur du degré de liberté comme 24 et un niveau de signification de 5%, un regard sur le tableau de distribution de la valeur t donne une valeur de 2,064. La comparaison de cette valeur avec la valeur calculée de 2,247 indique que la valeur t calculée est supérieure à la valeur de la table à un niveau de signification de 5 %. Il est donc possible de rejeter l’hypothèse nulle selon laquelle il n’y a pas de différence entre les moyennes. L’ensemble de la population présente des différences intrinsèques, et elles ne sont pas le fruit du hasard.