You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Para comenzar, incentivamos a por favor utilizar el formato que se solicita en el enunciado para hacer las issues. A partir de ahora NO se contestarán issues que no tengan este formato.
Al final se explica por qué algunas issues no fueron contestadas.
Actualizaciones de enunciado:
Las fechas deben ir en formato YYYY-MM-DD, esto se especificó en las reglas de negocio.
Se agregó el atributo codigo_reserva en la descripción del archivo usuarios_rescatados.csv, ya que el archivo lo tenía pero el enunciado no.
Se agregó a las reglas de negocio, que todo registro que tenga su RUN, debe tener dígito verificador, por lo que se agregó en el formato de los datos que Dv es no nulo.
Transportes contaba con un código reserva repetido, por lo que se eliminó uno de ellos.
Se añadieron los dominios de los correos permitidos en las reglas de negocio.
Se arregló el formato de los teléfonos de contacto que tenían un bug que ponía ? y !.
En los archivos existen atributos que tienen formato de lista, estos atributos deben ir sin comillas ni corchetes, separados por “;” entre ellos.
Se modificaron algunos atributos en el enunciado, ahora permiten la existencia de nulos.
Aclaraciones
Si un archivo .csv tiene un dato modificado, nulo o faltante, sólo se tiene que eliminar el registro (tupla) si el dato permite la identificación de la tupla y no se puede arreglar o si el dato es nulo y su formato no lo admite. Los registros descartados tienen que ser agregados al archivo mencionado en el enunciado.
La etapa consiste en analizar, interpretar y explicar las decisiones tomadas para descartar y limpiar datos. Posteriormente programar la limpieza de datos.
En el enunciado se especifican claramente los tipos de datos y su formato para cada atributo, por lo que si un valor de un atributo tiene una alteración que lo saca de su tipo de dato significa que el valor del atributo debe intentar ser arreglado de alguna forma.
Para responder las dudas sobre nombres con “Sra”, “Sr”, etc. Piensen en el formato de los nombres, es decir, string. ¿El formato indica que no se puede tener eso en el nombre?
No es necesario modificar los strings a sus versiones sin tilde.
El RUN puede usar ‘k’ mayúscula o minúscula.
Los teléfonos siguen el formato [código de país] X XXXX XXXX (incluye los espacios).
La idea es que las decisiones que tomen siempre lleven a que haya una respuesta correcta. Si llegamos a considerar que hay algún atributo que en realidad tiene más de una correcta, se considerará a la hora de corregir.
El contenido de los archivos limpios no es necesario que esté ordenado en base a ningún atributo.
En la ayudantía del viernes van a ver cosas relacionadas a limpieza de datos, que responde algunas de las preguntas más específicas de sus issues.
En los archivos “empleados_rescatados.csv” y “usuarios_rescatados.csv” está el atributo codigo_agenda, el cual es único, si este está presente en tuplas de ambos archivos, tiene que quedarse con el dato más completo, o sea, el que tenga menos atributos null.
Se puede hacer uso de código externo NO IA, siempre y cuando no sea copiado textualmente y que se haya citado.
Si en una tupla un codigo_reserva está presente en usuarios_rescatados.csv, pero no en empleados_rescatados.csv, igual se debe considerar la tupla dejando los atributos nulos.
Si un estado_disponibilidad se encuentra como "No disponible", no es necesario verificar si existe la reserva señalada, solo agregar los datos al archivo correspondiente.
En los archivos existen atributos que tienen formato de lista, estos atributos deben ir sin comillas ni corchetes, separados por “;” entre ellos.
Issues no contestadas
Algunas de las issues realizadas no fueron consideradas por diversas razones, las cuales serán mencionadas a continuación (tomar en consideración que hay varias cosas que se pueden encontrar en google, por lo que busquen antes de hacer issues).
#5 Click para ver
Se estaba viendo este caso con anterioridad, por eso no se respondió por acá. #6 Click para ver
No se contestó porque no tiene que ver con el proyecto.
Por último, es importante mencionar que hay algunas consultas dentro de algunas issues que no se contestaron, por ejemplo “qué diferencia tienen tales tipos de datos”, cosa que puede buscar y encontrar la respuesta. Los alentamos fuertemente a hacer búsquedas en su navegador, hay muchos sitios web que pueden contener la respuesta que necesitan. Si luego de un rato buscando realmente no encuentran la respuesta, pueden hacer una issue al respecto.
reacted with thumbs up emoji reacted with thumbs down emoji reacted with laugh emoji reacted with hooray emoji reacted with confused emoji reacted with heart emoji reacted with rocket emoji reacted with eyes emoji
-
Para comenzar, incentivamos a por favor utilizar el formato que se solicita en el enunciado para hacer las issues. A partir de ahora NO se contestarán issues que no tengan este formato.
Este discussions contiene las respuestas a las siguientes issues:
#2 Click para ver
#3 Click para ver
#4 Click para ver
#7 Click para ver
#9 Click para ver
#10 Click para ver
#12 Click para ver
#13 Click para ver
#14 Click para ver
#15 Click para ver
Al final se explica por qué algunas issues no fueron contestadas.
Actualizaciones de enunciado:
Aclaraciones
Si un archivo .csv tiene un dato modificado, nulo o faltante, sólo se tiene que eliminar el registro (tupla) si el dato permite la identificación de la tupla y no se puede arreglar o si el dato es nulo y su formato no lo admite. Los registros descartados tienen que ser agregados al archivo mencionado en el enunciado.
La etapa consiste en analizar, interpretar y explicar las decisiones tomadas para descartar y limpiar datos. Posteriormente programar la limpieza de datos.
En el enunciado se especifican claramente los tipos de datos y su formato para cada atributo, por lo que si un valor de un atributo tiene una alteración que lo saca de su tipo de dato significa que el valor del atributo debe intentar ser arreglado de alguna forma.
Para responder las dudas sobre nombres con “Sra”, “Sr”, etc. Piensen en el formato de los nombres, es decir, string. ¿El formato indica que no se puede tener eso en el nombre?
No es necesario modificar los strings a sus versiones sin tilde.
El RUN puede usar ‘k’ mayúscula o minúscula.
Los teléfonos siguen el formato [código de país] X XXXX XXXX (incluye los espacios).
La idea es que las decisiones que tomen siempre lleven a que haya una respuesta correcta. Si llegamos a considerar que hay algún atributo que en realidad tiene más de una correcta, se considerará a la hora de corregir.
El contenido de los archivos limpios no es necesario que esté ordenado en base a ningún atributo.
En la ayudantía del viernes van a ver cosas relacionadas a limpieza de datos, que responde algunas de las preguntas más específicas de sus issues.
En los archivos “empleados_rescatados.csv” y “usuarios_rescatados.csv” está el atributo codigo_agenda, el cual es único, si este está presente en tuplas de ambos archivos, tiene que quedarse con el dato más completo, o sea, el que tenga menos atributos null.
Se puede hacer uso de código externo NO IA, siempre y cuando no sea copiado textualmente y que se haya citado.
Si en una tupla un codigo_reserva está presente en usuarios_rescatados.csv, pero no en empleados_rescatados.csv, igual se debe considerar la tupla dejando los atributos nulos.
Si un estado_disponibilidad se encuentra como "No disponible", no es necesario verificar si existe la reserva señalada, solo agregar los datos al archivo correspondiente.
En los archivos existen atributos que tienen formato de lista, estos atributos deben ir sin comillas ni corchetes, separados por “;” entre ellos.
Issues no contestadas
Algunas de las issues realizadas no fueron consideradas por diversas razones, las cuales serán mencionadas a continuación (tomar en consideración que hay varias cosas que se pueden encontrar en google, por lo que busquen antes de hacer issues).
#5 Click para ver
Se estaba viendo este caso con anterioridad, por eso no se respondió por acá.
#6 Click para ver
No se contestó porque no tiene que ver con el proyecto.
Por último, es importante mencionar que hay algunas consultas dentro de algunas issues que no se contestaron, por ejemplo “qué diferencia tienen tales tipos de datos”, cosa que puede buscar y encontrar la respuesta. Los alentamos fuertemente a hacer búsquedas en su navegador, hay muchos sitios web que pueden contener la respuesta que necesitan. Si luego de un rato buscando realmente no encuentran la respuesta, pueden hacer una issue al respecto.
Beta Was this translation helpful? Give feedback.
All reactions