Qu’est-ce qu’un échantillon ?
Un échantillon est une version plus petite et plus facile à gérer d’un groupe plus important. Il s’agit d’un sous-ensemble contenant les caractéristiques d’une population plus importante. Les échantillons sont utilisés dans les tests statistiques lorsque la taille de la population est trop importante pour que le test puisse inclure tous les membres ou observations possibles. Un échantillon doit représenter la population dans son ensemble et ne pas refléter un biais vers un attribut spécifique.
Points clés à retenir
- Un échantillon est une version plus petite et plus facile à gérer d’un groupe ou d’un sous-ensemble plus important d’une population.
- L’utilisation d’échantillons permet aux chercheurs de mener leurs études facilement et en temps utile.
- Afin d’obtenir un échantillon non biaisé, la sélection doit être aléatoire afin que chaque personne de la population ait une chance égale et probable d’être ajoutée au groupe échantillon.
- Dans l’échantillonnage aléatoire simple, chaque entité de la population est identique, tandis que l’échantillonnage aléatoire stratifié divise l’ensemble de la population en plus petits groupes.
Comprendre les échantillons
Un échantillon est un nombre d’observations non biaisées prélevées sur une population. En termes simples, une population est le nombre total d’individus, d’animaux, d’articles, d’observations, de données, etc. d’un sujet donné. L’échantillon, en d’autres termes, est une partie, un élément ou une fraction de l’ensemble du groupe, et agit comme un sous-ensemble de la population. Les échantillons sont utilisés dans divers contextes où des recherches sont menées. Les scientifiques, les spécialistes du marketing, les agences gouvernementales, les économistes et les groupes de recherche font partie de ceux qui utilisent des échantillons pour leurs études et leurs mesures.
L’utilisation de populations entières pour la recherche s’accompagne de défis, c’est pourquoi des échantillons sont utilisés. Les chercheurs peuvent avoir des difficultés à accéder facilement à des populations entières. Et en raison de la nature de certaines études, les chercheurs peuvent avoir des difficultés à obtenir les résultats dont ils ont besoin en temps utile. C’est pourquoi les personnes qui mènent les études utilisent des échantillons. En utilisant un nombre réduit de personnes représentant l’ensemble de la population, on peut toujours obtenir des résultats valables tout en réduisant le temps et les ressources.
Les échantillons utilisés par les chercheurs doivent ressembler de près à la population. Tous les participants de l’échantillon doivent partager les mêmes caractéristiques et qualités. Ainsi, si l’étude porte sur des hommes en première année d’université, l’échantillon doit être constitué d’un petit pourcentage d’hommes correspondant à cette description. De même, si un groupe de recherche mène une étude sur les habitudes de sommeil des femmes célibataires de plus de 50 ans, l’échantillon ne doit comprendre que des femmes appartenant à cette population.
Imaginez une équipe de chercheurs universitaires qui veulent savoir combien d’étudiants ont étudié pendant moins de 40 heures pour l’examen du CFA et l’ont quand même réussi. Étant donné que plus de 200 000 personnes passent l’examen chaque année dans le monde, il peut être extrêmement fastidieux et long d’entrer en contact avec chaque participant à l’examen. En fait, le temps que les données de la population soient collectées et analysées, quelques années se seraient écoulées, rendant l’analyse sans valeur puisqu’une nouvelle population aurait émergé. Ce que les chercheurs peuvent faire à la place, c’est prendre un échantillon de la population et obtenir des données à partir de cet échantillon.
Pour obtenir un échantillon non biaisé, la sélection doit être aléatoire afin que tous les membres de la population aient une chance égale d’être ajoutés au groupe.
Afin d’obtenir un échantillon non biaisé, la sélection doit être aléatoire afin que chaque personne de la population ait une chance égale et probable d’être ajoutée au groupe échantillon. Cette méthode est similaire à un tirage de loterie et constitue la base d’un échantillonnage aléatoire simple.
Types d’échantillonnage
Échantillonnage aléatoire simple
L’échantillonnage aléatoire simple est idéal si chaque entité de la population est identique. Si les chercheurs ne se soucient pas de savoir si les sujets de leur échantillon sont tous des hommes ou des femmes ou une combinaison des deux sexes sous une forme ou une autre, l’échantillonnage aléatoire simple peut être une bonne technique de sélection.
Disons que 200 000 personnes se sont présentées à l’examen du CFA en 2016, dont 40 % de femmes et 60 % d’hommes. L’échantillon aléatoire tiré de la population devrait donc compter 400 femmes et 600 hommes pour un total de 1 000 candidats.
Mais qu’en est-il des cas où il est important de connaître le ratio hommes/femmes qui ont réussi un test après avoir étudié moins de 40 heures ? Dans ce cas, un échantillon aléatoire stratifié serait préférable à un simple échantillon aléatoire.
Échantillonnage aléatoire stratifié
Ce type d’échantillonnage, également appelé échantillonnage aléatoire proportionnel ou échantillonnage aléatoire par quotas, divise l’ensemble de la population en plus petits groupes. Ces groupes sont connus sous le nom de strates. Les personnes au sein des strates partagent des caractéristiques similaires.
Et si l’âge était un facteur important que les chercheurs aimeraient inclure dans leurs données ? En utilisant la technique de l’échantillonnage aléatoire stratifié, ils pourraient créer des couches ou des strates pour chaque groupe d’âge. La sélection de chaque strate devrait être aléatoire afin que chaque personne de la tranche ait une chance d’être incluse dans l’échantillon. Par exemple, deux participants, Alex et David, ont respectivement 22 et 24 ans. La sélection de l’échantillon ne peut pas se faire sur la base d’un mécanisme préférentiel. Ils doivent tous deux avoir une chance égale d’être sélectionnés dans leur tranche d’âge. Les strates pourraient ressembler à ceci :
Strates (âge) | Nombre de personnes dans la population | Nombre à inclure dans l’échantillon |
20-24 | 30,000 | 150 |
25-29 | 70,000 | 350 |
30-34 | 40,000 | 200 |
35-39 | 30,000 | 150 |
40-44 | 20,000 | 100 |
>44 | 10,000 | 50 |
Total | 200,000 | 1,000 |
Dans le tableau, la population a été divisée en groupes d’âge. Par exemple, 30 000 personnes âgées de 20 à 24 ans ont passé l’examen du CFA en 2016. En utilisant cette même proportion, le groupe échantillon aura (30.000 ÷ 200.000) x 1.000 = 150 candidats qui se trouvent dans ce groupe. Alex ou David – ou les deux ou aucun des deux – peuvent être inclus parmi les 150 participants à l’examen aléatoire de l’échantillon.
Il existe de nombreuses autres strates qui pourraient être compilées lors du choix de la taille de l’échantillon. Certains chercheurs peuvent utiliser les fonctions, les pays, l’état civil, etc. des personnes testées pour décider de la manière de créer l’échantillon.
Exemples d’échantillons
En 2017, la population mondiale était de 7,5 milliards d’habitants, dont 49,6 % de femmes et 50,4 % d’hommes. Le nombre total de personnes dans un pays donné peut également être une taille de population. Le nombre total d’étudiants dans une ville peut être considéré comme une population, et le nombre total de chiens dans une ville est également une taille de population. Des échantillons peuvent être prélevés dans ces populations à des fins de recherche.
En suivant l’exemple de l’examen de CFA, les chercheurs ont pu prendre un échantillon de 1 000 participants au CFA sur les 200 000 personnes qui ont passé l’examen, soit la population, et ont obtenu les données nécessaires sur ce nombre. La moyenne de cet échantillon serait prise pour estimer la moyenne des candidats à l’examen CFA qui ont réussi même s’ils n’ont étudié que pendant moins de 40 heures.
Le groupe d’échantillons prélevés ne doit pas être biaisé. Cela signifie que si la moyenne de l’échantillon des 1 000 participants à l’examen du CFA est de 50, la moyenne de la population des 200 000 candidats à l’examen devrait également être d’environ 50.