Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Formato inconsistente en listas de strings #15

Open
IgnacioParraS opened this issue Mar 12, 2025 · 0 comments
Open

Formato inconsistente en listas de strings #15

IgnacioParraS opened this issue Mar 12, 2025 · 0 comments

Comments

@IgnacioParraS
Copy link

En el archivo empleados_descartados.csv , específicamente en las columnas que almacenan listas de strings (como comodidades, escalas y paradas), algunos datos aparecen con un formato inconsistente. Por ejemplo:

{TV,Comida,""Asientos reclinables"",Wifi,Calefacción,""Aire acondicionado"",Agua}

En este caso, se observa que algunos elementos de la lista están entre comillas dobles (""Asientos reclinables"", ""Aire acondicionado""), mientras que otros no tienen comillas (TV, Comida, Wifi, etc.). Esto genera dos interrogantes:

  1. ¿Es necesario normalizar los datos al escribir en los archivos OK.csv dentro de SCV_limpios?

Es decir, ¿debemos "limpiar" las listas de strings, eliminando las comillas dobles innecesarias y asegurando un formato uniforme? Por ejemplo, convertir el string anterior en:

{TV,Comida,Asientos reclinables,Wifi,Calefacción,Aire acondicionado,Agua}

o por el contrario,
2. ¿Indica este formato inconsistente un error en la tupla completa?

¿La presencia de comillas dobles en algunos elementos sugiere que la tupla entera está en un formato erróneo y, por lo tanto, debería descartarse? En otras palabras, ¿es este un indicador de que los datos no deberían incluirse en los archivos OK.csv?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant