From 6716bc0ee97b75b336e304430c77329b2bf8c258 Mon Sep 17 00:00:00 2001 From: Hannes Wuensche Date: Mon, 27 Jan 2025 11:33:07 +0100 Subject: [PATCH] Fixing Typos --- Readme.md | 36 +++++++++++++++++++----------------- 1 file changed, 19 insertions(+), 17 deletions(-) diff --git a/Readme.md b/Readme.md index 5167df9..88defd4 100644 --- a/Readme.md +++ b/Readme.md @@ -20,7 +20,7 @@ Robert Koch-Institut. (2025). Gesundheitsberichterstattung - Daten zu nichtüber ## Informationen zum Datensatz und Entstehungskontext -Die Gesundheitsberichterstattung (GBE) des RKI informiert regelmäßig über die gesundheitliche Situation der Bevölkerung in Deutschland. Das Themenspektrum ist vielfältig und reicht von Gesundheitszustand und Einflussfaktoren auf die Gesundheit über Gesundheitsförderung, Prävention und gesundheitliche Versorgung bis hin zu den damit verbundenen Kosten. +Die Gesundheitsberichterstattung (GBE) am RKI informiert regelmäßig über die gesundheitliche Situation der Bevölkerung in Deutschland. Das Themenspektrum ist vielfältig und reicht von Gesundheitszustand und Einflussfaktoren auf die Gesundheit über Gesundheitsförderung, Prävention und gesundheitliche Versorgung bis hin zu den damit verbundenen Kosten. Der Fokus des vorliegenden Datensatzes liegt auf Indikatoren zu nichtübertragbaren Erkrankungen (noncommunicable diseases, [NCD](https://www.who.int/news-room/fact-sheets/detail/noncommunicable-diseases)), wie Diabetes mellitus, Herz-Kreislauf-Erkrankungen, Krebs und psychischen Störungen sowie deren Einflussfaktoren. @@ -34,7 +34,7 @@ Die Veröffentlichung der Daten, die Kuration sowie das Qualitätsmanagement der Die Gesundheitsberichterstattung am RKI hat zum Ziel, verlässliche Informationen zur gesundheitlichen Lage der Bevölkerung in Deutschland regelmäßig verschiedenen Zielgruppen bereitzustellen ([Ziese et al. 2020]( https://doi.org/10.1007/s00103-020-03195-8)). Zum einen sollen die Informationen auf gesundheitliche Problemlagen und Handlungsbedarfe hinweisen. Zum anderen soll die Informationen bei der Entwicklung von Präventionsmaßnahmen und deren Evaluation unterstützen. -Im Rahmen der Entwicklung einer [NCD-Surveillance](www.rki.de/diabsurv) am RKI soll das Krankheitsgeschehen wichtiger körperlicher Erkrankungen und psychischer Störungen abgebildet werden. Neben der Häufigkeit der Erkrankungen und Störungen sollen auch die Einflussfaktoren, insbesondere das Gesundheitsverhalten und soziale Determinanten, sowie die gesundheitliche Versorgung und die Krankheitsfolgen beleuchtet werden. Die NCD-Surveillance soll dabei bestehende Surveillance-Projekte am RKI (Diabetes-Surveillance, Mental-Health-Surveillance, Burden of Disease und AdiMon) zusammenführen. Der Gesundheitsberichterstattung kommt dabei die Aufgabe der kontinuierlichen und zeitnahen Berichterstattung zu. +Im Rahmen der Entwicklung einer [NCD-Surveillance](httpswww.rki.de/diabsurv) am RKI soll das Krankheitsgeschehen wichtiger körperlicher Erkrankungen und psychischer Störungen abgebildet werden. Neben der Häufigkeit der Erkrankungen und Störungen sollen auch die Einflussfaktoren, insbesondere das Gesundheitsverhalten und soziale Determinanten, sowie die gesundheitliche Versorgung und die Krankheitsfolgen beleuchtet werden. Die NCD-Surveillance soll dabei bestehende Surveillance-Projekte am RKI (Diabetes-Surveillance, Mental-Health-Surveillance, Burden of Disease und AdiMon) zusammenführen. Der Gesundheitsberichterstattung kommt dabei die Aufgabe der kontinuierlichen und zeitnahen Berichterstattung zu. Die Webseite der Gesundheitsberichterstattung (www.gbe.rki.de) soll Nutzerinnen und Nutzern einen einfachen und transparenten Zugang sowohl zu den Ergebnissen der NCD-Surveillance als auch zu den anderen Produkten der Gesundheitsberichterstattung und weiterführenden Publikationen geben. Der inhaltliche Fokus liegt dabei zunächst auf den nichtübertragbaren Erkrankungen und deren Einflussfaktoren. @@ -53,7 +53,7 @@ Ein großer Teil der Indikatoren wird auf Basis von Primärdaten aus Gesundheits Jeder Indikator bildet eine spezifische epidemiologische Kennzahl zu einem spezifischen Thema ab. Zumeist handelt es sich um Prävalenzen, d.h. die Kennzahl bildet den Anteil der Personen mit einer bestimmten Eigenschaft zu einem Zeitpunkt oder innerhalb eines spezifischen Zeitraums ab. Ein Beispiel hierfür ist der Indikator *Obst- und Gemüsekonsum*, der den Anteil von Personen ab 18 Jahren in der Bevölkerung, die täglich Obst und Gemüse verzehren, widergibt. Weiterhin werden auch Inzidenzen (Neuerkrankungsraten) oder andere epidemiologische Maßzahlen verwendet. -Die Berechnung der Indikatoren erfolgt stratifiziert nach Berichtsjahr, Geschlecht, Altersgruppe, Bundesland oder Region. Zusätzlich erfolgt wenn möglich eine Stratifizierung nach Bildung basierend auf Individualdaten oder nach regionaler sozioökonomische Deprivation, wenn die Informationen zur Bildung auf individueller Ebene nicht vorliegen. In Abhängigkeit der Datenquelle sind Besonderheiten bei der Berechnung der Indikatoren zu beachten. So findet bei Auswertung der GEDA-Daten beispielsweise eine Gewichtung statt. +Die Berechnung der Indikatoren erfolgt stratifiziert nach Berichtsjahr, Geschlecht, Altersgruppe, Bundesland oder Region. Zusätzlich erfolgt wenn möglich eine Stratifizierung nach Bildung basierend auf Individualdaten oder nach regionaler sozioökonomischer Deprivation, wenn die Informationen zur Bildung auf individueller Ebene nicht vorliegen. In Abhängigkeit der Datenquelle sind Besonderheiten bei der Berechnung der Indikatoren zu beachten. So findet bei Auswertung der GEDA-Daten beispielsweise eine Gewichtung statt. Für die Datenaufbereitung der Sekundärdaten wurde die Statistik-Software *R (Version 4.3.0)* und das Package *tidyverse (2.0.0)* verwendet. Die Auswertung von Befragungsdaten des RKI (zum Beispiel Daten aus den [GEDA-Studien](https://www.rki.de/geda)) inklusive der Altersstandardisierung erfolgte mit dem Package *srvyr (1.2.0)*. @@ -61,7 +61,7 @@ Die genaue Beschreibung der Definition, Operationalisierung und Berechnung ist i #### Limitationen und Einordnung des Datensatzes -Limitationen ergeben sich aus den Datenquellen sowie aus der Methodik zur Berechnung der Indikatoren. Zum einen können sich aus der verwendeten Datenquelle Selektionseffekte ergeben. So sind beispielsweise in den GEDA-Studien nur deutschsprachige Personen eingeschlossen oder in den Analysen basierend auf Routinedaten der gesetzlichen Krankenversicherung sind keine Informationen zu Personen in der privaten Krankenversicherung enthalten. Weiterhin kann es zu Verzerrungen durch die Definition des Indikators in der jeweiligen Datenquelle kommen. Dies bedeutet beispielsweise bei Auswertungen von Befragungsdaten nur bereits bekannte (diagnostizierte) Erkrankungen erfasst werden oder bei Sekundärdaten nur Personen, für welche die Erkrankung auch dokumentiert wurde. +Limitationen ergeben sich aus den Datenquellen sowie aus der Methodik zur Berechnung der Indikatoren. Zum einen können sich aus der verwendeten Datenquelle Selektionseffekte ergeben. So sind beispielsweise in den GEDA-Studien nur deutschsprachige Personen eingeschlossen oder in den Analysen basierend auf Routinedaten der gesetzlichen Krankenversicherung sind keine Informationen zu Personen in der privaten Krankenversicherung enthalten. Weiterhin kann es zu Verzerrungen durch die Definition des Indikators in der jeweiligen Datenquelle kommen. Dies bedeutet beispielsweise, dass bei Auswertungen von Befragungsdaten nur bereits bekannte (diagnostizierte) Erkrankungen erfasst werden oder bei Sekundärdaten nur Personen, für welche die Erkrankung auch dokumentiert wurde. Auf die spezifischen Limitationen der einzelnen Indikatoren wird in der Beschreibung der Methodik unter „Qualität der Daten“ eingegangen. @@ -203,19 +203,19 @@ Die Datei [GBE_Indikatoren_nichtuebertragbarer_Erkrankungen.tsv](https://github. | Zeitraum_ISO | string | | Zeitraum im ISO-Format (JJJJ-MM-TT--JJJJ-MM-TT: Anfangs- und Enddatum des Bezugszeitraums), auf den sich der Wert bezieht | | Zeitraum_Name | string | | Textliche Bezeichnung des Zeitraums, z.B. `JJJJ` = Zeitraum eines kompletten Jahres oder `JJJJ/JJ` für den Zeitraum einer Grippe-Saison | | Geschlecht_ID | integer | Werte: `0`, `1`, `2`
Fehlende Werte: `NA` | ID des Geschlechts (Definition siehe Beschreibung des jeweiligen Indikators): `0`=Gesamt, `1`=Weiblich, `2`=Männlich. Enthält `NA`, wenn der Indikator nicht auf Geschlecht bezogen ist. | -| Geschlecht_Name | string | Werte: `Weiblich`, `Männlich`, `Gesamt`
Fehlende Werte: `NA` | Textliche Bezeichnung des Geschlechts. Enthält `NA`, wenn der Indikator nicht auf Geschlecht bezogen ist. | +| Geschlecht_Name | string | Werte: `Gesamt`, `Weiblich`, `Männlich`
Fehlende Werte: `NA` | Textliche Bezeichnung des Geschlechts. Enthält `NA`, wenn der Indikator nicht auf Geschlecht bezogen ist. | | Alter_ID | string | Werte: `11-13`, `14-17`, `15-24`, `15-29`, `15-59`, `18-24`, `18-29`, …
Fehlende Werte: `NA` | Altersgruppen in Jahren in der Form "von-bis", z.B. `30-39`= 30- bis 39-Jahre, oder in der Form "von+", z.B. `75+`= >=75 Jahre. Der Wert `00+` beinhaltet alle Altersgruppen. Enthält `NA`, wenn der Indikator nicht altersbezogen ist. | | Alter_Name | string | Werte: `11-13 Jahre`, `14-17 Jahre`, `15-24 Jahre`, `15-29 Jahre`, `15-59 Jahre`, `18-24 Jahre`, `18-29 Jahre`, …
Fehlende Werte: `NA` | Textliche Bezeichnung der Altersgruppe. Enthält `NA`, wenn der Indikator nicht altersbezogen ist. | | Region_ID | string | Werte: `00`, `01`, `02`, `03`, `04`, `05`, `06`, … | Land, Bundesland bzw. Region: `00` = Deutschland, `01`-`16` Bundesländer, `21`-`25` Zusammenfassung der Bundesländer in fünf Regionen (siehe Tabelle oben), `AT`-`UA` europäische Länder nach ISO 3166-1-ALPHA-2 | | Region_Name | string | Werte: `Baden-Württemberg`, `Bayern`, `Belgien`, `Berlin`, `Bosnien und Herzegowina`, `Brandenburg`, `Bremen`, … | Textliche Bezeichnung der Region | | Bildung_Casmin_ID | integer | Werte: `0` - `3`
Fehlende Werte: `NA` | Bildungsstatus anhand des CASMIN-Indexes (Brauns et al. 2003). Dieser verwendet Angaben zu schulischer und beruflicher Bildung und ermöglicht die Einteilung des Bildungsstatus in `1`=niedrig, `2`=mittel und `3`=hoch. Die Ausprägung `0`= Gesamt beinhaltet alle Bildungsgruppen. Enthält `NA`, wenn der Indikator nicht nach Bildung stratfiziert wurde. | -| Bildung_Casmin_Name | string | Werte: `Gesamt`, `hoch`, `mittel`, `niedrig`
Fehlende Werte: `NA` | Textliche Bezeichnung der Bildung. Enthält `NA`, wenn der Indikator nicht nach Bildung stratfiziert wurde. | +| Bildung_Casmin_Name | string | Werte: `Gesamt`, `niedrig`, `mittel`, `hoch`
Fehlende Werte: `NA` | Textliche Bezeichnung der Bildung. Enthält `NA`, wenn der Indikator nicht nach Bildung stratfiziert wurde. | | GISD_ID | integer | Werte: `0` - `3`
Fehlende Werte: `NA` | Regionale sozioökonomische Deprivation auf Grundlage des German Index of Socioeconomic Deprivation (GISD) (Michalski et al. 2022). Der GISD fasst Merkmale der Erwerbs-, Bildungs- und Einkommenssituation für jeden Kreis und jede kreisfreie Stadt in einer Kennzahl zusammen. Die Kreise werden entlang ihrer GISD-Werte in Quintile von niedriger bis hoher sozioökonomischer Deprivation eingeteilt, die über den Wohnort verknüpft werden: Einteilung der Deprivation in `1`=hoch (5. Quintil), `2`=mittel (2. – 4. Quintil) und `3`=niedrig (1. Quintil). Die Ausprägung `0`=Gesamt beinhaltet alle Quintile. Unterschiede in den Werten nach sozioökonomischer Deprivation beziehen sich auf die räumliche Ebene.
Enthält `NA`, wenn der Indikator nicht nach GISD stratfiziert wurde. | | GISD_Name | string | Werte: `Gesamt`, `hoch (5. Quintil)`, `mittel (2.-4. Quintil)`, `niedrig (1. Quintil)`
Fehlende Werte: `NA` | Textliche Bezeichnung der regionalen sozioökonomische Deprivation. Enthält `NA`, wenn der Indikator nicht nach GISD stratfiziert wurde. | | Berufliche_Qualifikation_ID | integer | Werte: `0` - `3`
Fehlende Werte: `NA` | Berufliches Qualifikationsniveau. Unterschiedung in `1`=ohne abgeschlossene Berufsausbildung, `2`=betrieblich/schulische Ausbildung und `3`=akademische Ausbildung. Die Ausprägung `0`=Gesamt beinhaltet alle beruflichen Qualifikationsniveaus.
Enthält `NA`, wenn der Indikator nicht nach beruflicher Qualifikation stratfiziert wurde. | -| Berufliche_Qualifikation_Name | string | Werte: `Gesamt`, `akademische Ausbildung`, `betrieblich/schulische Ausbildung`, `ohne abgeschlossene Berufsausbildung`
Fehlende Werte: `NA` | Textliche Bezeichnung der beruflichen Qualifikation. Enthält `NA`, wenn der Indikator nicht nach beruflicher Qualifikation stratfiziert wurde. | +| Berufliche_Qualifikation_Name | string | Werte: `Gesamt`, `ohne abgeschlossene Berufsausbildung`, `betrieblich/schulische Ausbildung`, `akademische Ausbildung`
Fehlende Werte: `NA` | Textliche Bezeichnung der beruflichen Qualifikation. Enthält `NA`, wenn der Indikator nicht nach beruflicher Qualifikation stratfiziert wurde. | | Standardisierung_ID | integer | Werte: `0`, `3` | Art der Standardierung für die Berechnung des Wertes:
`0` = beobachtet
`3` = altersstandardisiert | -| Standardisierung_Name | string | Werte: `altersstandardisiert`, `beobachtet` | Textliche Bezeichnung der Standardisierung | +| Standardisierung_Name | string | Werte: `beobachtet`, `altersstandardisiert` | Textliche Bezeichnung der Standardisierung | | Wert | number | Fehlende Werte: `NA` | Wert der Kennzahl. Enthält `NA`, wenn wegen zu hoher Unsicherheit (Unsicherheit =`2`) der errechnete Wert nicht veröffentlicht wird. | | Unteres_Konfidenzintervall | number | Fehlende Werte: `NA` | Untere Grenze des 95%-Konfidenzintervalls.
Enthält `NA`, wenn wegen zu hoher Unsicherheit (Unsicherheit =`2`) der errechnete Wert nicht veröffentlicht wird oder für den Wert kein Konfidenzintervall berechnet wurde. | | Oberes_Konfidenzintervall | number | Fehlende Werte: `NA` | Obere Grenze des 95%-Konfidenzintervalls.
Enthält `NA`, wenn wegen zu hoher Unsicherheit (Unsicherheit =`2`) der errechnete Wert nicht veröffentlicht wird oder für den Wert kein Konfidenzintervall berechnet wurde. | @@ -286,7 +286,8 @@ Der Datensatz "Gesundheitsberichterstattung - Daten zu nichtübertragbaren Erkra Die im Datensatz bereitgestellten Daten sind, unter Bedingung der Namensnennung des Robert Koch-Instituts als Quelle, frei verfügbar. Das bedeutet, jede Person hat das Recht die Daten zu verarbeiten und zu verändern, Derivate des Datensatzes zu erstellen und sie für kommerzielle und nicht kommerzielle Zwecke zu nutzen. Weitere Informationen zur Lizenz finden sich in der [LICENSE](https://github.com/robert-koch-institut/Gesundheitsberichterstattung_-_Daten_zu_nichtuebertragbaren_Erkrankungen/blob/main/LICENSE) bzw. [LIZENZ](https://github.com/robert-koch-institut/Gesundheitsberichterstattung_-_Daten_zu_nichtuebertragbaren_Erkrankungen/blob/main/LIZENZ) Datei des Datensatzes. -## Appendix +## Appendix + ### Indikator 'Soziale Unterstützung (ab 18 Jahre)' Indikator_ID: 1010301 @@ -307,13 +308,14 @@ Die Erfassung des Grades der sozialen Unterstützung wird mittels der etablierte GEDA 2009, GEDA 2010, GEDA 2012, GEDA 2014/2015-EHIS, GEDA 2019/2020-EHIS, GEDA 2022, GEDA 2023 -* 1. „Wie viele Menschen stehen Ihnen so nahe, dass Sie sich auf sie verlassen können, wenn Sie ernste persönliche Probleme haben?“ -* Antwortmöglichkeiten: „Keine“ (1), „1 bis 2“ (2), „3 bis 5“ (3), „6 oder mehr“ (4) -* 2. „Wie viel Anteilnahme und Interesse zeigen andere Menschen an dem, was Sie tun?“ -* Antwortmöglichkeiten: „Sehr viel Anteilnahme und Interesse“ (5), „Viel Anteilnahme und Interesse“ (4), „Weder viel noch wenig“ (3), „Wenig Anteilnahme und Interesse“ (2), „Keine Anteilnahme und Interesse“ (1) -* 3. „Wie einfach ist es für Sie, praktische Hilfe von Nachbarn zu erhalten, wenn Sie diese benötigen?“ -* Antwortmöglichkeiten: „Sehr einfach“ (5), „Einfach“ (4), „Möglich“ (3), „Schwierig“ (2), „Sehr schwierig“ (1) -* Anhand der Antworten wird ein Summenscore gebildet (Range: 3 – 14): „Geringe soziale Unterstützung“ wird bei Punktwerten 3 – 8, „mittlere soziale Unterstützung“ bei Punktwerten 9 – 11 und „starke soziale Unterstützung“ bei Punktwerten 12 – 14 angenommen. +1. „Wie viele Menschen stehen Ihnen so nahe, dass Sie sich auf sie verlassen können, wenn Sie ernste persönliche Probleme haben?“ + + Antwortmöglichkeiten: „Keine“ (1), „1 bis 2“ (2), „3 bis 5“ (3), „6 oder mehr“ (4) +2. „Wie viel Anteilnahme und Interesse zeigen andere Menschen an dem, was Sie tun?“ + + Antwortmöglichkeiten: „Sehr viel Anteilnahme und Interesse“ (5), „Viel Anteilnahme und Interesse“ (4), „Weder viel noch wenig“ (3), „Wenig Anteilnahme und Interesse“ (2), „Keine Anteilnahme und Interesse“ (1) +3. „Wie einfach ist es für Sie, praktische Hilfe von Nachbarn zu erhalten, wenn Sie diese benötigen?“ + + Antwortmöglichkeiten: „Sehr einfach“ (5), „Einfach“ (4), „Möglich“ (3), „Schwierig“ (2), „Sehr schwierig“ (1) + + Anhand der Antworten wird ein Summenscore gebildet (Range: 3 – 14): „Geringe soziale Unterstützung“ wird bei Punktwerten 3 – 8, „mittlere soziale Unterstützung“ bei Punktwerten 9 – 11 und „starke soziale Unterstützung“ bei Punktwerten 12 – 14 angenommen. #### Bezugspopulation @@ -2736,4 +2738,4 @@ Die Statistik der Sterbefälle ist eine Vollerhebung mit Auskunftspflicht. Sie u #### Berechnung -* **Beschreibung:** Die Lebenserwartung bei Geburt beschreibt die durchschnittliche \ No newline at end of file +* **Beschreibung:** Die Lebenserwartung bei Geburt beschreibt die durchschnittliche