En la temática EDUCACIÓN se determinó fallas en el siguiente conjunto de datos:
- Primer conjunto de datos: Becas (Educación)
Dentro de la información de Becas existen los archivos de metadatos, diccionario y dos bases de datos. Existen varios problemas con esta información.
-El diccionario contiene la información correcta para una de las bases. Para la otra base está incompleto; contiene variables que la segunda base no tiene, y así mismo, la segunda base contiene variables que el diccionario no posee. En particular existe una variable en la segunda base que incluye montos de dinero para las becas, pero se desconoce las unidades (el rango es de 1 a 990, no se puede dar becas de $1; 1 es equvalente a 10? 100? 100? No se sabe).
-Datos incompletos: existen variables que tienen datos perdidos (celdas vacías), y en otras las celdas no están vacías pero se tiene algo similar a “No hay registro”.
-Existen variables que tienen información en diferentes formatos, por ejemplo 9 y 9% que son contados como diferentes. Además existen una columna que incluye datos discretos y también intervalos, por ejemplo 7 y “entre 5 y 10” en la misma columna.
En conclusión: La base de datos Becas requiere un proceso de limpieza en algunas de sus variables, en particular “Porcentaje de discapacidad” y “Monto contratado”.
- Segundo conjunto de datos: Instituciones Educativas del Sistema de Educación Intercultural Bilingüe.
Contiene tres archivos de datos: Metadatos, biblioteca y base de datos. Al revisar la base de datos no se encontraron celdas vacías ni datos extraños, pero al comparar con la descripción que tienen los datos en biblioteca se observaron las siguientes inconsistencias:
Nombre Institución: indica que se antepone la palabra a los nombres de la Institución: Centro educativo cuando es Educación Inicial, Escuela Básica cuando es Educación General Básica y Colegio de Bachillerato, pero en la base de datos no se encuentra así, van los nombres de forma directa sin especificar el tipo de institución.
Sostenimiento: en la base de datos se debe incorporar la subclasificación de Particular (Laico o religioso)
Jurisdicción: todos son intercultural bilingüe, por lo que no es necesaria la indicación de intercultural.
- Tercer conjunto de datos: Ser Estudiante Mitad del Mundo 2020-06-07, se determinó:
-El diccionario contiene varias celdas vacías que se podrían reemplazar por guiones para diferenciar la descripción de las celdas llenas.
A su vez en Código de provincia prescindir de dígito 0 para números de 1 al 9 (id_provCódigo de provincia donde se rindió el examen).
Agregar descripción de base en metadata de disponibilidad en años de 1970, 1978, 1981, 1986-2013 sin 4 años (1988, 1992, 1994, 2013) (na_eano Año de nacimiento del sustentante).
Adicional en la base registra ningún estudiante con discapacidad (discap Indica si el sustentante tiene alguna discapacidad).
Y de Puntaje alcanzado por el sustentante de 400 a 986, no determina bajo que parámetros es la escala y rango específico (inev Puntaje alcanzado por el sustentante).
La base Ser Estudiante Mitad del Mundo no determina nacionalidad del sustentante que bajo la descripción dertermina como propósito: “garantizar el acceso a la educación de niños, niñas y jóvenes que por su condición extranjera, solicitan un cupo en cualquier institución del Sistema Educativo Nacional”.
En proceso de limpieza bajo categorías establecidas no determina mayor proceso de limpieza; excepto si se realizaría comparación con más bases de la misma temática excepto Reporte de fortalecimiento a las Organizaciones de la Economía Popular y Solidaria 2021 que no concuerda con temática Educación.