Le rééchantillonnage

Le rééchantillonnage est la méthode qui consiste à dessiner des échantillons répétés à partir des échantillons de données d’origine. La méthode de rééchantillonnage est une méthode non paramétrique d’inférence statistique. En d’autres termes, la méthode de rééchantillonnage n’implique pas l’utilisation des tables de distribution génériques (par example des tables de distribution normales) pour calculer des valeurs de probabilité approchées p.

Le rééchantillonnage implique la sélection de cas randomisés avec remplacement de l’échantillon de données d’origine de telle sorte que chaque nombre de l’échantillon tiré comporte un certain nombre de cas similaires à l’échantillon de données d’origine. En raison du remplacement, le nombre d’échantillons prélevés qui sont utilisés par la méthode de rééchantillonnage est constitué de cas répétitifs.

Le rééchantillonnage génère une distribution d’échantillonnage unique sur la base des données réelles. La méthode de rééchantillonnage utilise des méthodes expérimentales plutôt que des méthodes analytiques pour générer la distribution d’échantillonnage unique. La méthode de rééchantillonnage donne des estimations impartiales car elle est basée sur des échantillons impartiaux de tous les résultats possibles des données étudiées par le chercheur.

Le rééchantillonnage est également connu sous le nom d’amorçage ou d’estimation Monte Carlo. Afin de comprendre le concept de rééchantillonnage, le chercheur doit comprendre les termes d’amorçage et d’estimation de Monte Carlo:

  • La méthode d’amorçage, qui est équivalente à la méthode de rééchantillonnage, utilise des échantillons répétés de l’échantillon de données d’origine afin de calculer la statistique de test.
  • L’estimation Monte Carlo, qui est également équivalente à la méthode d’amorçage, est utilisée par le chercheur pour obtenir les résultats de rééchantillonnage.

Hypothèses

Cette méthode de rééchantillonnage ignore généralement les hypothèses paramétriques qui consistent à ignorer la nature de la distribution de données sous-jacente. Par conséquent, la méthode est basée sur des hypothèses non paramétriques.

Lors du rééchantillonnage, il n’y a pas d’exigence spécifique de taille d’échantillon. Par conséquent, plus l’échantillon est grand, plus les intervalles de confiance générés par la méthode de rééchantillonnage sont fiables.

Il y a un risque accru de bruit de surajustement dans les données. Ce type de problème peut être résolu facilement en combinant la méthode de rééchantillonnage avec le processus de validation croisée.

Rééchantillonnage dans SPSS

Dans SPSS, le chercheur peut effectuer la méthode de rééchantillonnage de la manière suivante:

Après avoir sélectionné « Tests non paramétriques » dans le menu analyser, le chercheur clique sur « Deux tests d’échantillons indépendants », où le chercheur trouve un bouton « Exact ». Cela permet au chercheur de faire un choix entre les types d’estimations de signification. Un de ces choix que le chercheur peut faire inclut la méthode de « Monte Carlo », qui est également une méthode d’amorçage et de rééchantillonnage.

Les solutions statistiques peuvent vous aider à déterminer la taille de l’échantillon / l’analyse de puissance pour votre étude de recherche. Pour en savoir plus, visitez notre page Web sur l’analyse de la taille de l’échantillon / de la puissance, ou contactez-nous dès aujourd’hui.