Dieses Dokument beschreibt die Vorprozessierung und explorative Analyse des Datensatzes, der Grundlage des auf srf.ch veröffentlichten Artikels Wie das Parlament die Wähler abbildet – und wie nicht ist.
SRF Data legt Wert darauf, dass die Datenvorprozessierung und -Analyse nachvollzogen und überprüft werden kann. SRF Data glaubt an das Prinzip offener Daten, aber auch offener und nachvollziehbarer Methoden. Zum anderen soll es Dritten ermöglicht werden, auf dieser Vorarbeit aufzubauen und damit weitere Auswertungen oder Applikationen zu generieren.
Das Endprodukt des vorliegenden Scripts, neben der explorativen Analyse, sind (Datenbeschreibung siehe unten):
councillors.json: Datensatz aller Parlamentarier mit Geschlecht, Altersgruppe, Stadt-Land-Kategorisierung, Zivilstand, Bildung und Religionszugehörigkeit als JSONrepresentation.json: Datensatz mit Ist- und Soll-Werten für die untersuchten Kategorien (Geschlecht, Altersgruppe etc.) als JSON
Die Vorprozessierung und Analyse wurde im Statistikprogramm R vorgenommen. Das zugrunde liegende Script sowie die prozessierten Daten können unter diesem Link heruntergeladen werden. Durch Ausführen von main.Rmd kann der hier beschriebene Prozess nachvollzogen und der für den Artikel verwendete Datensatz generiert werden. Dabei werden Daten aus dem Ordner input eingelesen und Ergebnisse in den Ordner output geschrieben.
SRF Data verwendet das rddj-template von Timo Grossenbacher als Grundlage für seine R-Scripts. Entstehen bei der Ausführung dieses Scripts Probleme, kann es helfen, die Anleitung von rddj-template zu studieren.
Der Code für die vorliegende Datenprozessierung ist auf https://github.com/srfdata/2019-08-representation zur freien Verwendung verfügbar.
2019-08-representation von SRF Data ist lizenziert unter einer Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International Lizenz.
Code & Daten von SRF Data sind unter http://srfdata.github.io verfügbar.
Die veröffentlichten Informationen sind sorgfältig zusammengestellt, erheben aber keinen Anspruch auf Aktualität, Vollständigkeit oder Richtigkeit. Es wird keine Haftung übernommen für Schäden, die durch die Verwendung dieses Scripts oder der daraus gezogenen Informationen entstehen. Dies gilt ebenfalls für Inhalte Dritter, die über dieses Angebot zugänglich sind.
| Attribut | Typ | Beschreibung |
|---|---|---|
| id | Numeric | Offizielle Id der Parlamentarischen Dienste |
| fistName | String | Vorname der Parlamentarier |
| lastName | String | Nachname der Parlamentarier |
| ageGroup | String | Altersgruppe der Parlamentarier (sieben Kategorien) |
| gender | String | Geschlecht der Parlamentarier (m, f) |
| urbanRural | String | Stadt-Land-Einteilung der Parlamentarier gemäss Raumgliederung des BfS, vier Kategorien (big_city, urban, periurban, rural) |
| maritalStatus | String | Zivilstand der Parlamentarier |
| education | String | Höchste Ausbildung der Parlamentarier |
| religion | String | Religionszugehörigkeit der Parlamentarier |
| party | String | Partei der Parlamentarier |
| Attribut | Typ | Beschreibung |
|---|---|---|
| category | String | Kategoriebezeichnung in Englisch für die jeweilige demografische Angabe |
| group | String | Unterschiedliche Einteilungen der jeweiligen Kategorie (Geschlecht, Altersgruppen etc.) |
| is | Numeric | Ist-Wert für eine Gruppe: So viele Parlamentarier unter 30 Jahren sitzen im Parlament |
| should | Numeric | Soll-Wert für eine Gruppe: So viel Parlamentarier unter 30 Jahren müssten im Vergleich zur ständigen Wohnbevölkerung über 15 Jahren im Parlament sitzen |
→ input/councillorsCouncillor-export_de_ergaenzt_mit_religion.csv
Die Daten über die Parlamentarier stammen von den Parlamentarischen Diensten und wurden von Smartvote durch die eigene Datenbank und weitere Recherchen ergänzt. Im Datensatz befinden sich neben den verwendeten Kategorien auch noch weitere Angaben (Beruf, Sprache etc.) enthalten.
→ input/Missing Data Parlamentarians - Sheet1.csv
Ergänzung des obigen Datensatzes durch eigene Recherche. 99 Parlamentarier wurden per Mail (Code für den automatisierten Mailversand weiter unten) angefragt, fehlende Daten zu ergänzen. Davon haben 64 Parlamentarier geantwortet.
→ input/je-d-01.02.03.02.xlsx
Die Daten zur ständigen Wohnbevölkerung nach Alter haben wir von der Webseite des Bundesamts für Statistik (BfS) heruntergeladen.
→ input/je-d-01.08.02.01.xlsx
Die Daten zur ständigen Wohnbevölkerung ab 15 Jahren nach Religionszugehörigkeit haben wir von der Webseite des BfS heruntergeladen.
→ input/su-d-01.02.03.03.xlsx
Die Daten zur ständigen Wohnbevölkerung nach Zivilstand haben wir von der Webseite des BfS heruntergeladen.
→ input/su-d-40.02.15.08.01-2017.xlsx
Die Daten zur ständigen Wohnbevölkerung ab 15 Jahren nach Bildung haben wir von der Webseite des BfS heruntergeladen.
→ input/su-d-01.02.03.06.xlsx
Die Daten zur ständigen Wohnbevölkerung nach Alter und Gemeinde haben wir von der Webseite des BfS heruntergeladen.
→ input/Raumgliederungen.xlsx
Die Einteilung der Wohnorte der Parlamentarier in urban, periurban und rural haben wir der Raumgliederung des BfS entnommen (Gemeindetypologie 2012, 25 Typen, 9 Kategorien und Stadt/Land-Typologie). Die Tabelle haben wir aus der Applikation der Schweizer Gemeinden des BfS exportiert. Wir haben den offiziellen Gemeindestand vom 02.04.2017 verwendet mit 2240 Einträgen.
