Qu’est-ce qu’une hypothèse nulle ?
Une hypothèse nulle est un type d’hypothèse utilisé en statistique qui propose qu’il n’y a pas de différence entre certaines caractéristiques d’une population (ou processus de génération de données).
Par exemple, un joueur peut être intéressé par la question de savoir si un jeu de hasard est équitable. S’il est équitable, alors les gains escomptés par jeu sont de 0 pour les deux joueurs. Si le jeu n’est pas équitable, alors les gains escomptés sont positifs pour un joueur et négatifs pour l’autre. Pour vérifier si le jeu est équitable, le joueur recueille des données sur les gains de nombreuses répétitions du jeu, calcule les gains moyens à partir de ces données, puis teste l’hypothèse nulle selon laquelle les gains escomptés ne sont pas différents de zéro.
Si les gains moyens tirés des données de l’échantillon sont suffisamment éloignés de zéro, le joueur rejettera l’hypothèse nulle et conclura à l’hypothèse alternative, à savoir que les gains attendus par jeu sont différents de zéro. Si le revenu moyen de l’échantillon est proche de zéro, le joueur ne rejettera pas l’hypothèse nulle, mais conclura que la différence entre la moyenne des données et 0 s’explique par le seul hasard.
Points clés à retenir
- Une hypothèse nulle est un type de conjecture utilisé en statistique qui propose qu’il n’y a pas de différence entre certaines caractéristiques d’une population ou d’un processus de production de données.
- L’hypothèse alternative propose qu’il y a une différence.
- Le test d’hypothèse fournit une méthode permettant de rejeter une hypothèse nulle dans les limites d’un certain niveau de confiance. (Les hypothèses nulles ne peuvent cependant pas être prouvées).
1:33
Comment fonctionne une hypothèse nulle
L’hypothèse nulle, également connue sous le nom de conjecture, suppose que toute différence entre les caractéristiques choisies que vous voyez dans un ensemble de données est due au hasard. Par exemple, si les gains attendus pour le jeu de hasard sont vraiment égaux à 0, alors toute différence entre les gains moyens dans les données et 0 est due au hasard.
Les hypothèses statistiques sont testées selon un processus en quatre étapes. La première étape consiste pour l’analyste à énoncer les deux hypothèses afin qu’une seule puisse être juste. L’étape suivante consiste à formuler un plan d’analyse, qui décrit comment les données seront évaluées. La troisième étape consiste à exécuter le plan et à analyser physiquement les données de l’échantillon. La quatrième et dernière étape consiste à analyser les résultats et soit à rejeter l’hypothèse nulle, soit à affirmer que les différences observées sont explicables par le seul hasard.
Les analystes cherchent à rejeter l’hypothèse nulle parce que c’est une conclusion forte. Cela nécessite des preuves solides sous la forme d’une différence observée qui est trop importante pour être expliquée uniquement par le hasard. Ne pas rejeter l’hypothèse nulle, à savoir que les résultats sont explicables par le seul hasard, est une conclusion faible
parce qu’elle permet que des facteurs autres que le hasard soient à l’œuvre, mais ne soient pas suffisamment forts pour être détectables par le test statistique utilisé.
Important
Les analystes cherchent à rejeter
l’hypothèse nulle pour exclure le hasard seul comme explication des phénomènes d’intérêt.
Exemple d’hypothèse nulle
Voici un exemple simple : Une directrice d’école affirme que les élèves de son école obtiennent une moyenne de 7 sur 10 aux examens. L’hypothèse nulle est que la moyenne de la population est de 7,0. Pour tester cette hypothèse nulle, nous enregistrons les notes de 30 élèves (échantillon) par exemple, sur l’ensemble de la population scolaire de l’école (300 élèves par exemple) et nous calculons la moyenne de cet échantillon. Nous pouvons ensuite comparer la moyenne de l’échantillon (calculée) à la moyenne de la population (hypothétique) de 7,0 et tenter de rejeter l’hypothèse nulle. (L’hypothèse nulle ici, selon laquelle la moyenne de la population est de 7,0, ne peut pas être prouvée à l’aide des données de l’échantillon ; elle peut seulement être rejetée).
Prenons un autre exemple : Le rendement annuel d’un fonds commun de placement particulier est estimé à 8 %. Supposons que le fonds commun de placement existe depuis 20 ans. L’hypothèse nulle est que le rendement moyen du fonds commun de placement est de 8 %. Nous prenons un échantillon aléatoire des rendements annuels du fonds commun de placement pendant, disons, cinq ans (échantillon) et calculons la moyenne de l’échantillon. Nous comparons ensuite la moyenne de l’échantillon (calculée) à la moyenne de la population (revendiquée) (8 %) pour tester l’hypothèse nulle.
Pour les exemples ci-dessus, les hypothèses nulles sont :
- Exemple A : Les élèves de l’école obtiennent une moyenne de 7 sur 10 aux examens.
- Exemple B : Le rendement annuel moyen du fonds commun de placement est de 8 % par an.
Pour déterminer s’il faut rejeter l’hypothèse nulle, on suppose, pour les besoins de l’argumentation, que l’hypothèse nulle (abréviation H0) est vraie. Ensuite, la fourchette probable des valeurs possibles de la statistique calculée (par exemple, la note moyenne des tests de 30 étudiants) est déterminée en vertu de cette présomption (par exemple, la fourchette des moyennes plausibles pourrait aller de 6,2 à 7,8 si la moyenne de la population est de 7,0). Ensuite, si la moyenne de l’échantillon se situe en dehors de cette fourchette, l’hypothèse nulle est rejetée. Dans le cas contraire, la différence est dite « explicable par le seul hasard », c’est-à-dire qu’elle se situe dans la fourchette déterminée par le seul hasard.
Un point important à noter est que nous testons l’hypothèse nulle parce qu’il y a un élément de doute sur sa validité. Toutes les informations qui vont à l’encontre de l’hypothèse nulle déclarée sont saisies dans l’hypothèse alternative (H1). Pour les exemples ci-dessus, l’hypothèse alternative serait
- Les élèves obtiennent une moyenne qui n’est pas égale à 7.
- Le rendement annuel moyen du fonds commun de placement n’est pas égal à 8 % par an.
En d’autres termes, l’hypothèse alternative est une contradiction directe de l’hypothèse nulle.
Test d’hypothèse pour les investissements
À titre d’exemple lié aux marchés financiers, supposons qu’Alice constate que sa stratégie d’investissement produit des rendements moyens plus élevés que le simple fait d’acheter et de détenir une action. L’hypothèse nulle stipule qu’il n’y a pas de différence entre les deux rendements moyens, et Alice est encline à le croire jusqu’à preuve du contraire. Pour réfuter l’hypothèse nulle, il faudrait faire preuve d’une signification statistique, qui peut être trouvée à l’aide de divers tests. L’hypothèse alternative indiquerait que la stratégie d’investissement a un rendement moyen plus élevé qu’une stratégie d’achat et de conservation traditionnelle.
Un outil qui peut être utilisé pour déterminer la signification statistique des résultats est la valeur p. Une valeur p représente la probabilité qu’une différence aussi grande ou plus grande que la différence observée entre les deux rendements moyens puisse se produire uniquement par hasard.
Une valeur p inférieure ou égale à 0,05 est souvent utilisée pour indiquer s’il existe des preuves contre l’hypothèse nulle. Si Alice effectue l’un de ces tests, par exemple un test utilisant le modèle normal, et prouve que la différence entre ses rendements et les rendements d’achat et de conservation est significative (la p-value est inférieure ou égale à 0,05), elle peut alors rejeter l’hypothèse nulle et conclure l’hypothèse alternative.