Qu’est-ce qu’une statistique du chi carré ?
Une statistique du chi carré(χ2)est un test qui mesure comment un modèle se compare aux données réelles observées. Les données utilisées dans le calcul d’une statistique du chi carré doivent être aléatoires, brutes, mutuellement exclusives, tirées de variables indépendantes et provenant d’un échantillon suffisamment important. Par exemple, les résultats d’un tirage au sort équitable répondent à ces critères.
Les tests du chi carré sont souvent utilisés pour vérifier les hypothèses. La statistique du chi carré compare la taille des écarts éventuels entre les résultats attendus et les résultats réels, compte tenu de la taille de l’échantillon et du nombre de variables dans la relation. Pour ces tests, des degrés de liberté sont utilisés pour déterminer si une certaine hypothèse nulle peut être rejetée en fonction du nombre total de variables et d’échantillons de l’expérience. Comme pour toute statistique, plus la taille de l’échantillon est importante, plus les résultats sont fiables.
Points clés à retenir
- Une statistique du chi carré(χ2)est une mesure de la différence entre les fréquences observées et attendues des résultats d’un ensemble d’événements ou de variables.
- χ2 dépend de l’importance de la différence entre les valeurs réelles et observées, des degrés de liberté et de la taille des échantillons.
- χ2 peut être utilisé pour tester si deux variables sont liées ou indépendantes l’une de l’autre ou pour tester la qualité de l’ajustement entre une distribution observée et une distribution théorique des fréquences.
La formule du khi-deux est
(s)
c2= Ei (Oi-Ei∑)2 χoù : c=Degrésde liberté O=Valeur(s)observée(s)
Que vous dit une statistique du khi-deux ?
Il existe deux principaux types de tests du chi carré : le test d’indépendance, qui pose une question de relation, comme « Y a-t-il un lien entre le sexe de l’étudiant et le choix de cours », et le test de validité de l’ajustement, qui pose une question comme « La pièce de monnaie que je tiens en main correspond-elle à une pièce de monnaie théoriquement juste ?
Indépendance
En ce qui concerne le sexe des étudiants et le choix des cours, on peut utiliser un test d’indépendance surχ2 . Pour réaliser ce test, le chercheur recueillerait des données sur les deux variables choisies (sexe et cours choisis) et comparerait ensuite les fréquences auxquelles les étudiants et les étudiantes choisissent parmi les cours proposés en utilisant la formule donnée ci-dessus et un tableau statistiqueχ2.
S’il n’y a pas de relation entre le sexe et la sélection des cours (c’est-à-dire s’ils sont indépendants), alors les fréquences réelles auxquelles les étudiants et les étudiantes sélectionnent chaque cours offert devraient être approximativement égales ou, inversement, la proportion d’étudiants et d’étudiantes dans tout cours sélectionné devrait être approximativement égale à la proportion d’étudiants et d’étudiantes dans l’échantillon. Un test d’indépendance surχ2 peut nous indiquer dans quelle mesure il est probable que le hasard puisse expliquer toute différence observée entre les fréquences réelles des données et ces attentes théoriques.
Bonté d’âme
χ2 permet de tester dans quelle mesure un échantillon de données correspond aux caractéristiques (connues ou supposées) de la population plus large que l’échantillon est censé représenter. Si les données de l’échantillon ne correspondent pas aux propriétés attendues de la population qui nous intéresse, alors nous ne voudrions pas utiliser cet échantillon pour tirer des conclusions sur la population plus large.
Prenons par exemple une pièce de monnaie imaginaire qui a exactement 50/50 de chances de tomber pile ou face et une pièce de monnaie réelle que vous lancez 100 fois. Si cette pièce réelle a une chance équitable, elle aura également une probabilité égale d’atterrir de chaque côté, et le résultat attendu d’un tirage au sort de 100 fois est que la pile et la face se lèveront respectivement 50 fois et 50 fois. Dans ce cas,χ2 peut nous dire dans quelle mesure les résultats réels de 100 lancers de pièce de monnaie se comparent au modèle théorique selon lequel une pièce de monnaie équitable donnera des résultats à 50/50. Le tirage réel pourrait être de 50/50, ou 60/40, ou même 90/10. Plus les résultats réels des 100 lancers sont éloignés de 50/50, moins cette série de lancers correspond à l’attente théorique de 50/50 et plus il est probable que nous puissions conclure que cette pièce n’est pas réellement une pièce de monnaie équitable.