larmarange / analyse-R

Introduction à l'analyse d'enquêtes avec R et RStudio
https://larmarange.github.io/analyse-R/
53 stars 40 forks source link

analyse-R/definir-un-plan-d-echantillonnage-complexe #117

Closed utterances-bot closed 2 years ago

utterances-bot commented 4 years ago

Définir un plan d’échantillonnage complexe

http://larmarange.github.io/analyse-R/definir-un-plan-d-echantillonnage-complexe.html

AnotherDataGuy commented 4 years ago

Bonjour,

Tout d'abord merci pour tous vos tutoriels. Je suis cette page depuis déjà deux ans (depuis que je connais R) et vos travaux constituent une source première lors de mes analyses.

Je me suis lancé dans l'analyse du "Barometre d’opinion de la drees sur la sante, la protection sociale, la precarite, la famille et la solidarite" (disponible ici : http://www.data.drees.sante.gouv.fr/ReportFolders/reportFolders.aspx) .

L'information fournie pour le plan d'échantillonage est celle-ci : "L’échantillon a été construit selon la méthode des quotas en termes de sexe, âge, profession de la personne de référence, après stratification par catégorie d’agglomération et région."

En suivant vos explications (et bien d'autres) j'ai fait le plan suivant mais je suis très hésitant :

BMT.JUST_2018_design <- svydesign(data = BMT.JUST, id = ~Agglo + Region, weights = ~poids, strata = ~ Agglo )

Ce qui me pose le plus souci c'est où inclure les éléments, dans quel paramètre. Ça et le fait que les explications me semblent floues quant aux quotas. De fait je ne sais pas comment les prendre en compte. Pourriez-vous m'éclairer ? Le plan que j'ai élaboré avec la fonction vous semble-t-il cohérent ?

Une V1 de l'analyse dans laquelle je n'ai pas pris en compte le plan d'échantillonage est disponible ici : https://anotherdataguy.github.io/JusticeIneg_FR/RapportJustIneg .

Je vous remercie en avance,

larmarange commented 4 years ago

Bonjour,

je ne suis pas un grand spécialistes des quotas, mais ce type d'enquêtes (où l'on fixe la distribution marginale à l'avance) ne peut pas, au sens strict, être interprétée comme une enquête aléatoire. Dans la pratique, une enquête par quotas sera analysée comme une enquête aléatoire simple.

L'extension survey ne prends pas en compte les quotas. On analysera donc la partie par quotas comme un échantillon simple.

Par contre, votre enquête est également stratifiée et il faudrait spécifier les strates à survey. Par contre, il n'y a pas de grappe ou cluster.

Dès lors, le code à indiquer devrait être :

svydesign(
  data = BMT.JUST, 
  id = ~ 1,
  weights  = ~ poids,
  strata = ~ Agglo + Région
)
AnotherDataGuy commented 4 years ago

Bonjour,

Merci pour votre réponse très opportune ! Je ne sais pas si je suis trop bête mais j'ai eu du mal à comprendre cette fonction. Il y a quelques semaines j'ai trouvé un document plutôt intéressant qui m'a aidé, comme votre article : http://faculty.nps.edu/rdfricke/OA4109/Lab%207%20--%20Intro%20to%20R%20Survey%20Package.pdf