Qu’est-ce que la valeur P ?
En statistique, la valeur p est la probabilité d’obtenir des résultats au moins aussi extrêmes que les résultats observés d’un test d’hypothèse statistique, en supposant que l’hypothèse nulle est correcte. La valeur p est utilisée comme alternative aux points de rejet pour fournir le plus petit niveau de signification auquel l’hypothèse nulle serait rejetée. Une valeur p plus petite signifie qu’il existe des preuves plus solides en faveur de l’hypothèse alternative.
Points clés à retenir
- Une valeur p est une mesure de la probabilité qu’une différence observée ait pu se produire par simple hasard.
- Plus la valeur p est faible, plus la signification statistique de la différence observée est grande.
- La valeur p peut être utilisée comme alternative ou en complément de niveaux de confiance présélectionnés pour la vérification d’hypothèses.
Comment la valeur P est-elle calculée ?
Les valeurs P sont généralement déterminées à l’aide de tableaux de valeurs P ou de tableurs ou de logiciels statistiques. Ces calculs sont basés sur la distribution de probabilité supposée ou connue de la statistique spécifique testée. Les valeurs P sont calculées à partir de l’écart entre la valeur observée et une valeur de référence choisie, compte tenu de la distribution de probabilité de la statistique, une plus grande différence entre les deux valeurs correspondant à une valeur p plus faible. Mathématiquement, la valeur p est calculée par le calcul intégral de l’aire sous la courbe de distribution des probabilités pour toutes les valeurs de la statistique qui sont au moins aussi éloignées de la valeur de référence que la valeur observée, par rapport à l’aire totale sous la courbe de distribution des probabilités. En bref, plus la différence entre deux valeurs observées est importante, moins il est probable que la différence soit due au simple hasard, ce qui se traduit par une valeur p plus faible.
Approche de la valeur P pour la vérification des hypothèses
L’approche de la valeur p pour la vérification des hypothèses utilise la probabilité calculée pour déterminer s’il existe des preuves pour rejeter l’hypothèse nulle. L’hypothèse nulle, également appelée conjecture, est l’affirmation initiale concernant une population (ou un processus de génération de données). L’hypothèse alternative indique si le paramètre de la population diffère de la valeur du paramètre de la population indiquée dans la conjecture.
Dans la pratique, le niveau de signification est indiqué à l’avance pour déterminer dans quelle mesure la valeur p doit être faible afin de rejeter l’hypothèse nulle. Étant donné que les chercheurs utilisent des niveaux de signification différents lorsqu’ils examinent une question, le lecteur peut parfois avoir des difficultés à comparer les résultats de deux tests différents. Les valeurs P apportent une solution à ce problème.
Par exemple, supposons qu’une étude comparant les rendements de deux actifs particuliers soit entreprise par différents chercheurs qui utilisent les mêmes données mais des niveaux de signification différents. Les chercheurs pourraient arriver à des conclusions opposées quant à savoir si les actifs diffèrent. Si un chercheur utilisait un niveau de confiance de 90% et que l’autre exigeait un niveau de confiance de 95% pour rejeter l’hypothèse nulle et que la valeur p de la différence observée entre les deux rendements était de 0,08 (correspondant à un niveau de confiance de 92%), alors le premier chercheur constaterait que les deux actifs présentent une différence statistiquement significative, tandis que le second ne trouverait aucune différence statistiquement significative entre les rendements.
Pour éviter ce problème, les chercheurs pourraient rendre compte de la valeur p du test d’hypothèse et permettre au lecteur d’interpréter lui-même la signification statistique. C’est ce que l’on appelle une approche de la valeur p du test d’hypothèse. Un observateur indépendant pourrait noter la valeur p et décider lui-même si cela représente une différence statistiquement significative ou non.
Exemple concret de valeur P
Supposons qu’un investisseur affirme que la performance de son portefeuille d’investissement est équivalente à celle de l’indice Standard & Poor’s (S&P) 500. Pour le déterminer, l’investisseur procède à un test bilatéral. L’hypothèse nulle indique que le rendement du portefeuille est équivalent à celui du S&P 500 sur une période donnée, tandis que l’hypothèse alternative indique que le rendement du portefeuille et celui du S&P 500 ne sont pas équivalents. (Si l’investisseur effectuait un test unilatéral, l’hypothèse alternative indiquerait que les rendements du portefeuille sont soit inférieurs, soit supérieurs aux rendements du S&P 500).
Le test de l’hypothèse de la valeur P ne fait pas nécessairement appel à un niveau de confiance présélectionné auquel l’investisseur doit réinitialiser l’hypothèse nulle d’équivalence des rendements. Il fournit plutôt une mesure de la quantité d’éléments permettant de rejeter l’hypothèse nulle. Plus la valeur p est faible, plus les preuves contre l’hypothèse nulle sont importantes. Ainsi, si l’investisseur trouve que la p-value est de 0,001, il existe des preuves solides contre l’hypothèse nulle, et l’investisseur peut conclure en toute confiance que les rendements du portefeuille et ceux du S&P 500 ne sont pas équivalents.
Bien que cela ne fournisse pas de seuil exact quant au moment où l’investisseur doit accepter ou rejeter l’hypothèse nulle, cela présente un autre avantage très pratique. La vérification de l’hypothèse de la valeur P offre un moyen direct de comparer la confiance relative que l’investisseur peut avoir lorsqu’il choisit parmi plusieurs types d’investissements ou de portefeuilles différents, par rapport à un indice de référence tel que le S&P 500. Par exemple, pour deux portefeuilles, A et B, dont la performance diffère de celle du S&P 500 avec des valeurs p de 0,10 et 0,01 respectivement, l’investisseur peut être beaucoup plus confiant que le portefeuille B, avec une valeur p inférieure, présentera en fait des résultats constamment différents.