La inequidad de género sigue siendo un problema fundamental en la mayoría de las sociedades, afectando múltiples áreas como la educación, la salud, la participación política y la economía. El Índice de Desigualdad de Género (GII, por sus siglas en inglés) es una medida integral que evalúa las disparidades de género en tres dimensiones clave: salud reproductiva, empoderamiento y participación económica. Este proyecto se basa en un conjunto de datos obtenidos de Kaggle (Gender Inequality Index by Country, 2023) que abarca indicadores de desigualdad de género desde 1990 hasta 2021 en diferentes regiones y países del mundo.
El objetivo principal de este proyecto es analizar y visualizar los datos sobre la inequidad de género en diferentes regiones y períodos de tiempo, con el fin de identificar patrones y áreas donde las disparidades de género son más pronunciadas. Las visualizaciones y análisis obtenidos ayudarán a generar conciencia sobre el estado actual de la inequidad de género y las brechas que aún persisten.
- Limpiar y organizar el conjunto de datos: Asegurarse de que no haya valores nulos o inconsistencias en las columnas del dataset, y preparar los datos para su posterior análisis.
- Comparar el Índice de Desarrollo Humano (IDH) y el Índice de Desigualdad de Género (GII): Analizar la relación entre estos dos índices para entender cómo se correlaciona el desarrollo humano con la equidad de género.
- Analizar las diferencias de inequidad de género por región: Examinar cómo varía la desigualdad de género entre diferentes áreas geográficas, incluyendo continentes, países, grupos de desarrollo humano y regiones en desarrollo según el PNUD.
- Visualizar la evolución de la inequidad de género a lo largo del tiempo: Crear gráficos temporales que muestren cómo han cambiado los indicadores de inequidad de género desde 1990 hasta 2021.
Para llevar a cabo este proyecto, se utilizaron las siguientes librerías de Python:
- Pandas: Para la manipulación y análisis de datos.
- NumPy: Para operaciones numéricas.
- Matplotlib y Seaborn: Para la creación de gráficos y visualizaciones.
- Eliminación de columnas irrelevantes: Se eliminaron las columnas que no aportaban valor al análisis.
- Manejo de valores nulos: Se imputaron o eliminaron los valores nulos según el contexto.
- Codificación de variables categóricas: Se realizó la codificación adecuada para facilitar el análisis.
- Análisis descriptivo: Se realizaron estadísticas descriptivas para entender la distribución de los datos.
- Visualizaciones: Se crearon gráficos de líneas, barras y mapas para explorar las tendencias en las diferencias de género a lo largo del tiempo y por región.
- Gráficos temporales: Se crearon gráficos de líneas que muestran la evolución de la inequidad de género desde 1990 hasta 2021.
- Mapas interactivos: Se generaron mapas utilizando Folium para mostrar las diferencias en la inequidad de género por continente y hemisferio.
Este proyecto proporciona una visión clara y comprensible de la inequidad de género a nivel global y regional, basándose en datos históricos de más de 30 años. Al utilizar técnicas de análisis de datos y visualización, se pretende generar conciencia sobre la situación actual y los avances necesarios para lograr una mayor igualdad de género. Las organizaciones y gobiernos podrán utilizar estos resultados para diseñar políticas más efectivas que promuevan la equidad.