Définition de l’importance statistique

Qu’est-ce que la signification statistique ?

La signification statistique fait référence à l’affirmation selon laquelle un résultat de données généré par des tests ou des expériences n’est pas susceptible de se produire de manière aléatoire ou fortuite, mais est plutôt susceptible d’être attribuable à une cause spécifique. La signification statistique est importante pour les disciplines universitaires ou les praticiens qui dépendent fortement de l’analyse des données et de la recherche, tels que l’économie, la finance, l’investissement, la médecine, la physique et la biologie.

La signification statistique peut être considérée comme forte ou faible. Lors de l’analyse d’un ensemble de données et de la réalisation des tests nécessaires pour discerner si une ou plusieurs variables ont un effet sur un résultat, une forte signification statistique permet de soutenir le fait que les résultats sont réels et non causés par la chance ou le hasard. En termes simples, si une valeur p est faible, le résultat est considéré comme plus fiable.

Les tests de signification statistique posent des problèmes car les chercheurs travaillent généralement avec des échantillons de populations plus importantes et non avec les populations elles-mêmes. Par conséquent, les échantillons doivent être représentatifs de la population, de sorte que les données contenues dans l’échantillon ne doivent être en aucune façon biaisées. Dans la plupart des sciences, y compris l’économie, la signification statistique est pertinente si une affirmation peut être faite à un niveau de 95% (ou parfois 99%).

Comprendre l’importance statistique

Le calcul de la signification statistique (test de signification) est sujet à un certain degré d’erreur. Le chercheur doit définir à l’avance la probabilité d’une erreur d’échantillonnage, qui existe dans tout test qui n’inclut pas la population entière.

La taille de l’échantillon est un élément important de la signification statistique dans la mesure où les grands échantillons sont moins sujets aux douveteaux. Seuls des échantillons aléatoires et représentatifs doivent être utilisés dans les tests de signification. Le niveau auquel on peut accepter qu’un événement soit statistiquement significatif est connu sous le nom de niveau de signification.

Les chercheurs utilisent une statistique test connue sous le nom de valeur p pour déterminer la signification statistique : si la valeur p tombe en dessous du niveau de signification, alors le résultat est statistiquement significatif. La valeur p est fonction des moyennes et des écarts types des échantillons de données.

La valeur p indique la probabilité selon laquelle le résultat statistique donné s’est produit, en supposant que le hasard est seul responsable du résultat. Si cette probabilité est faible, alors le chercheur peut sans risque considérer notre chance comme une cause. La valeur p doit se situer en dessous du niveau de signification pour que les résultats soient au moins considérés comme statistiquement significatifs.

vous pouvez intéressé:  Qui est Charlie Lee, le fondateur de Litecoin ?

L’opposé du niveau de signification, calculé comme 1 moins le niveau de signification, est le niveau de confiance. Il indique le degré de confiance que le résultat statistique n’a pas été obtenu par hasard ou par erreur d’échantillonnage. Le niveau de confiance habituel dans de nombreux tests statistiques est de 95 %, ce qui conduit à un niveau de signification habituel ou valeur p de 5 %.

Les points clés à retenir

  • La signification statistique se réfère à l’affirmation selon laquelle un résultat de données générées par des tests ou des expérimentations est susceptible d’être attribuable à une cause spécifique.
  • Si une statistique a une signification élevée, elle est alors considérée comme plus fiable.
  • Le calcul de la signification statistique est sujet à un certain degré d’erreur.
  • La signification statistique peut être mal interprétée lorsque les chercheurs n’utilisent pas le langage avec soin dans la présentation de leurs résultats.
  • Plusieurs types de tests de signification sont utilisés en fonction de la recherche menée

Considérations particulières

La signification statistique n’indique pas toujours la signification pratique, ce qui signifie que les résultats ne peuvent pas être appliqués à des situations commerciales réelles. En outre, la signification statistique peut être mal interprétée lorsque les chercheurs n’utilisent pas le langage avec soin dans la présentation de leurs résultats. Le fait qu’un résultat soit statistiquement significatif ne signifie pas qu’il n’est pas aléatoire, mais simplement que la probabilité qu’il le soit est fortement réduite.

Ce n’est pas parce que deux séries de données sont fortement corrélées entre elles qu’il y a un lien de causalité. Par exemple, le nombre de films dans lesquels l’acteur Nicolas Cage joue dans une année donnée est très fortement corrélé avec le nombre de noyades accidentelles dans les piscines. Mais cette corrélation est fausse, car il n’y a pas de lien de causalité théorique qui puisse être invoqué.

Un autre problème qui peut se poser en matière de signification statistique est que les données passées et les résultats de ces données, qu’ils soient statistiquement significatifs ou non, peuvent ne pas refléter les conditions actuelles ou futures. En matière d’investissement, cela peut se manifester dans un modèle de tarification qui s’effondre en période de crise financière, car les corrélations changent et les variables n’interagissent pas comme d’habitude. La signification statistique peut également aider un investisseur à discerner si un modèle d’évaluation des actifs est meilleur qu’un autre.

vous pouvez intéressé:  Comment fonctionnent les cartes de crédit ?

Types de tests de signification statistique

Plusieurs types de tests de signification sont utilisés en fonction de la recherche menée. Par exemple, les tests peuvent être utilisés pour un, deux ou plusieurs échantillons de données de tailles différentes pour les moyennes, les variances, les proportions, les données appariées ou non appariées, ou les différentes distributions de données.

L’hypothèse nulle

Tous ces facteurs ont ce qu’on appelle des hypothèses nulles, et la signification est souvent le but de la vérification des hypothèses en statistique. L’hypothèse nulle la plus courante est que le paramètre en question est égal à zéro (ce qui indique généralement qu’une variable a un effet nul sur le résultat qui nous intéresse). Si vous pouvez rejeter l’hypothèse nulle avec un niveau de confiance de 95 % ou plus, les chercheurs peuvent invoquer la signification statistique. Les hypothèses nulles peuvent également être testées pour vérifier l’égalité (plutôt que l’égalité à zéro) de l’effet pour deux ou plusieurs traitements alternatifs – par exemple, entre un médicament et un placebo dans un essai clinique.

Le rejet de l’hypothèse nulle, même si un degré très élevé de signification statistique ne peut jamais prouver quelque chose, ne peut qu’ajouter un soutien à une hypothèse existante. D’autre part, le fait de ne pas rejeter une hypothèse nulle est souvent un motif de rejet d’une hypothèse.

Un test de signification statistique partage en grande partie les mêmes mathématiques que le calcul d’un intervalle de confiance. Dans des situations courantes, une façon d’interpréter la signification statistique est que l’intervalle de confiance correspondant de 95 % ne contient pas la valeur zéro. Même si une variable est jugée statistiquement significative, elle doit toujours avoir un sens dans le monde réel.

En outre, un effet peut être statistiquement significatif mais n’avoir qu’un impact très faible. Par exemple, il peut être très improbable, par chance, que les entreprises qui utilisent du papier toilette à deux épaisseurs dans leurs salles de bains aient des employés plus productifs, mais l’amélioration de la productivité absolue de chaque travailleur sera probablement minuscule.

Retour haut de page