demokratie-live / democracy-client

DEMOCRACY App Client
https://www.democracy-deutschland.de/#!prototyp
Apache License 2.0
134 stars 28 forks source link

🚀 [Feature] Repräsentative Ergebnisse #1571

Open visionmakery opened 2 years ago

visionmakery commented 2 years ago

Dieses Ticket beschäftigt sich mit der Frage, (in) wie fern das Community repräsentativ werden kann.

Theorie

Stichprobe

Als Stichprobe bezeichnet man eine Teilmenge einer Grundgesamtheit (Population). Eine Stichprobenerhebung (Teilerhebung) als Alternative zur Vollerhebung wird angewandt, wenn die Untersuchung aller Individuen oder Objekte einer Grundgesamtheit nicht praktikabel ist.

Jede Stichprobe ist durch zwei Merkmale gekennzeichnet: ihre Größe (Stichprobenumfang, Stichprobengröße) und das verwendete Auswahlverfahren (Stichprobenart). Ein Auswahlverfahren ist die Art und Weise, wie die Elemente der Stichprobe möglichst zweckmäßig ausgewählt werden. Es gibt verschiedene Auswahlverfahren, die nachfolgend beschrieben werden.

Zufallsstichprobe

Eine Zufallsstichprobe ist notwendig, wenn die Stichprobe repräsentativ sein soll, d. h. wenn von ihr nach dem Induktionsprinzip auf die Grundgesamtheit geschlossen werden soll (siehe Hochrechnung).

Bewusste Auswahl

Bei einer systematischen Stichprobenziehung werden bereits bekannte Informationen über die auszuwählenden Fälle genutzt. Die Auswahl erfolgt anhand von Listen und festgelegten Regeln. Systematische Auswahlverfahren kommen zum Beispiel im kommerziellen Bereich (Markt- und Meinungsforschung) vor, wenn echte Zufallsstichproben zur Sicherung von Repräsentativität (im Sinne von Bevölkerungsrepräsentativität) zu aufwändig sind. Meist wird dann versucht, die Zusammensetzung der Bevölkerung näherungsweise durch Quotierung zentraler soziodemografischer Merkmale abzubilden (siehe Quotenstichprobe).

Willkürliche Stichproben

Bei willkürlichen Stichproben werden Elemente aus der Grundgesamtheit (etwa von einem Interviewer) mehr oder weniger willkürlich in die Stichprobe aufgenommen, oft gemäß Praktikabilität. Die Auswahl liegt im Ermessen der Forschenden (der Fragesteller sucht beispielsweise einzelne Passanten aus) oder der Probanden (die Befragten nehmen aus eigenem Antrieb an einer Befragung teil, siehe Selbstselektion). Stichproben mit willkürlichem Auswahlprinzip werden oft gewählt, da sie mit dem geringsten Aufwand und den geringsten Kosten verbunden sind.

Das Unternehmen Civey z.B. führt Online-Befragungen durch, indem die Besucher einer größeren Anzahl von Internetseiten durch ein eingeblendetes Werbe-Banner aufgefordert werden, an der Umfrage teilzunehmen. Die Teilnehmer suchen sich sozusagen selber aus. Überrepräsentiert sind dann Personen, die am Thema der Umfrage interessiert sind.

Repräsentativität

Wie bereits beschrieben, ist eine Zufallsstichprobe notwendig, wenn die Stichprobe repräsentativ sein soll. In Ermangelung des Zufallsprinzip (bei DEMOCRACY liegt auch eine Selbstselektion durch die Benutzer vor) könnte a) die Zusammensetzung der Bevölkerung näherungsweise durch Quotierung zentraler soziodemografischer Merkmale abgebildet werden (z.B. DEMOCRACY 10.000) b) wie bei Civey das Ergebnis (Rohdaten) in Richtung der Bevölkerung angepasst werden.

In Anbetracht der allgemeinen Akzeptanz von Civey-Umfragen scheint dieser methodische Nachteil breitenwirksam niemanden wirklich zu stören.

Praxis

Umsetzung in DEMOCRACY

freiwillige Mehrangaben

Die User können freiwillig weitere Angaben (Altersklasse [keine Angabe; 0-10;10-20,...], Geschlecht [keine Angabe;m;f;div], PLZ) in ihrem Profi machen.

Interaktive anonyme Ergebnisse

Der Ansatz, für den wir uns entscheiden wollen, setzt weiterhin auf die Standards von Wahlverfahren (Identität und Stimme trennen) anstatt auf die der Meinungsforschung (Identität und Stimme beibehalten).

In Analogie zu in unserem Konzept "Stimmanonymität" aufgeführten Punkt 3.2.3 werden die zusätzlichen Identitätsinformation des Nutzers, Altersklasse, Geschlecht und PLZ, mitsamt des JWT-Token des Nutzers und der Procedure ID an unseren Server übermittelt.

In der Voters-Tabelle bleibt es beim benannten Verfahren. Die Votes-Tabelle würde zusätzlich zu den 299+1 (keine Angabe) Wahlkreisaufschlüsselungen in Altersklasse (11) x Geschlecht (4) x PLZ (28.278+1) und damit um 1.244.276 in insgesamt 373.282.800 Stimmtöpfe aufgeschlüsselt.

Es gäbe damit technisch für jede Kombination (z.B. männlich, PLZ 37075, Altersklasse 20-30) eine eigene Votes-Tabelle. Durch Aggregation verschiedener Votes-Tabellen ("Töpfe") (z.B. alle männlichen Töpfe der Altersklasse 50-60) könnten so interaktive Ergebnisse erzeugt werden und gleichzeitig die Stimmanonymität aufrechterhalten.

Zwei Community-Ergebnisse

DEMOCRACY würde insofern auf zwei Community-Ergebnisse hinauslaufen, weil es immer User gibt, die keine (vollständigen) freiwilligen Angaben machen. Sobald ein User zusätzliche Informationen liefert, wird seine Stimme interaktiv auswertbar.

Des Weiteren könnte auf Basis der Stimmen mit vollständigen Zusatzangaben eine Hochrechnung gemäß CIVEY-Prinzip auf die Gesamtbevölkerung enstehen.