Este espacio está dedicado para compartir los avances de las actividades de este día.
Sobre las actividades, te dejamos una guía a continuación:
Para compartir los avances, cuéntanos lo siguiente:
-
Cuáles son esos conjuntos de datos afortunadas que seleccionaste para trabajar.
-
Los conjuntos de datos seleccionados ¿necesitaron del proceso de limpieza? Cuéntanos cómo realizaste el proceso de limpieza, si conocías una herramienta para ello, o si utilizaste alguna recomendada en la mentoría. Comparte esa experiencia en un párrafo.
Marca el check
cuando hayas realizado la actividad.
Seleccionar los conjuntos de datos definitivos que podrían tener respuestas a nuestras inquietudes.
INEVAL_serbachiller20_2021Noviembre
MINEDUC_RegistroAdministrativoHistorico_2009-2021Inicio
SENESCYT_Becas_2021Septiembe
Registro de Títulos SENESCYT
Realizar proceso de limpieza a esos conjuntos de datos seleccionados
Dentro del proceso de limpieza se desarrollo lo siguiente:
Se elimino signos innecesarios “-”.
Se elimino un registro en lo que respecta al AÑO SUSCRIPCIÓN en base a que solo existia un registro
Se procedió a la codificación de algunas variables como Provincia.
Se imputo algunas observaciones por no tener información como el caso de f1_s2_3_2.
Se homogenizo las respuestas como en el caso de la variable ProfesiOn/Especialidad con las respuesta BIOQUIMICO FARMACEUTICO.
En las variables títulos obtenidos y profesión se uso una respuesta puesto que existía la misma, pero con otros caracteres que al momento de procesar arrojaba como si existieran dos ejemplo el caso del titulo de economista, es la misma profesión, pero está escrita una respuesta con la primera letra en mayúscula, otra en minúscula y por último con espacio al final.
Para realizar la limpieza se utilizó el programa Excel con todas sus funcionalidades.