Hostname: page-component-89b8bd64d-r6c6k Total loading time: 0 Render date: 2026-05-06T12:07:49.545Z Has data issue: false hasContentIssue false

Sondages probabilistes et autres créatures mythiques : usages et limites de la calibration des sondages non probabilistes

Published online by Cambridge University Press:  19 August 2025

William Poirier*
Affiliation:
Département de science politique, Western University, 1151, Richmond St, London, ON, N6A 5C2, Canada
Anne-Sophie Charest
Affiliation:
Département de mathématiques et de statistique, Université Laval, 1045, avenue de la Médecine, Québec, Québec, G1V 0A6, Canada
Yannick Dufresne
Affiliation:
Département de science politique, Université Laval, 1030, avenue des Sciences-Humaines, Québec, Québec, G1V 0A6, Canada
Alexandre Fortier-Chouinard
Affiliation:
Département de science politique, Université Laval, 1030, avenue des Sciences-Humaines, Québec, Québec, G1V 0A6, Canada
Nadjim Fréchet
Affiliation:
Département de science politique, Université de Montréal, 3150, rue Jean-Brillant, Montréal, Québec, H3T 1N8, Canada
*
Auteur correspondant: William Poirier; Courriel: wpoirier@uwo.ca
Rights & Permissions [Opens in a new window]

Résumé

Cette note de recherche vise à offrir une première introduction aux enjeux de la recherche par sondage, en particulier lorsqu’on utilise des données provenant de panels non probabilistes, comme les sondages en ligne. Nous expliquons le concept clé d’ignorabilité, qui aide à comprendre comment les biais de sélection peuvent affecter les résultats, et comment certaines techniques statistiques – comme la post-stratification et le raking – peuvent tenter de les corriger. À l’aide de simulations, nous montrons dans quels contextes ces méthodes peuvent fonctionner, et dans quels cas elles échouent. Les résultats suggèrent que les sondages non probabilistes présentent des limites importantes pour produire des estimations valides, mais qu’il existe aussi des pistes pour en améliorer l’usage, surtout dans le contexte actuel où ces données sont de plus en plus courantes en sciences sociales.

Abstract

Abstract

This research note aims to provide an introductory overview of key issues in survey research, particularly when using data from non-probability panels such as online surveys. We introduce the central concept of ignorability, which helps clarify how selection bias can distort results and how certain statistical techniques – including post-stratification and raking – can be used to adjust for these biases. Through simulations, we explore the conditions under which these weighting methods succeed or fail. The results suggest that non-probability surveys face significant limitations in producing valid estimates but also highlight some promising ways to improve their use, especially given their growing prevalence in the social sciences.

Information

Type
Note de recherche/Research Note
Creative Commons
Creative Common License - CCCreative Common License - BY
This is an Open Access article, distributed under the terms of the Creative Commons Attribution licence (https://creativecommons.org/licenses/by/4.0/), which permits unrestricted re-use, distribution and reproduction, provided the original article is properly cited.
Copyright
© The Author(s), 2025. Published by Cambridge University Press on behalf of the Canadian Political Science Association (l’Association canadienne de science politique) and/et la Société québécoise de science politique
Figure 0

Figure 1. Représentation du mécanisme des biais de sélection.

Figure 1

Tableau 1. Exemple de tableau de stratification

Figure 2

Tableau 2. Exemple de raking – Proportions du sondage

Figure 3

Tableau 3. Exemple de raking – Étape 1

Figure 4

Tableau 4. Exemple de raking – Étape 2

Figure 5

Tableau 5. Exemple de raking – Convergence

Figure 6

Figure 2. Force de la relation avec les variables d’intérêts.Notes: Données issues de Projet Quorum et collectées du 26 janvier 2021 au 7 mars 2022; $n$=12 494. Les signes à l’intérieur des points représentent la direction de la relation. Les lignes pointillées correspondent à la corrélation moyenne entre les variables de pondération et les variables d’intérêts. Intervalles de confiance (95 %) générées par bootstrap à l’aide du progiciel confintr (Mayer, 2023). Libellé des questions au Tableau A.2 dans l’Annexe A.

Figure 7

Figure 3. Effet des techniques de correction sur l’estimation du niveau de pessimisme.Note: Données simulées à partir de Projet Quorum. 100 échantillons de 1000 unités par cas. ${\rm{\alpha }} = - 30,\;\;\beta = 1,7.\;$ Variables : $Y$ l’échelle de pessimisme, $F$ s’identifier comme femme, $V$ intention de voter pour le PCQ, $P$ opinion sur l’emprisonnement des individus ne respectant pas les mesures sanitaires. Corrélations : $Corr\left( {F,Y} \right) = 0,14$; $Corr\left( {V,Y} \right) = - 0,17$; $Corr\left( {P,Y} \right) = 0,25$.

Figure 8

Figure 4. Effet de la taille d’échantillon sur la magnitude de $\widehat {\overline Y} - \;\overline Y$.Note: Données issues d’une simulation. Tendances générées par régression linéaire (OLS). Points correspondant à la moyenne du biais brut des itérations. Dans tous les cas, N = 31 000 000, Y est continu et distribué normalement ($\overline Y = 0,{\sigma _y} = 1$),X est une échelle de Likert à 4 niveaux (0, 1, 2, 3), et Z est binaire (0, 1), indiquant l’inclusion dans l’échantillon.

Figure 9

Figure 5. Sensibilité de l’estimation à un biais de variable omise.Note: Données simulées à partir de Projet Quorum. Analyse réalisée sur l’un des échantillons de la Figure 3 pour chaque variable utilisée pour biaiser l’échantillon. Poids de pondérations produit à partir de raking sur les variables socio-démographiques utilisées plus haut. $R_{\rm{\varepsilon }}^2$ est le ratio de variation en ${w^*}$ expliqué par ${\rm{\varepsilon }}$.

Supplementary material: File

Poirier et al. supplementary material

Poirier et al. supplementary material
Download Poirier et al. supplementary material(File)
File 1.9 MB