Acerca del Equipo 5: Evil Machine

Equipo 05: Evil Machine

En este espacio de trabajo el Equipo deberá publicar sus avances, día a día. Encontrarán un post por cada día (Día 1 al 5) con el detalle de las actividades que deben realizar. En cada post deberán publicar sus avances del día correspondiente.

Coordinador/a:

Integrantes:

Erick Santiago Chicaiza Cuasapaz
Paúl Danilo López Simba
Ivanna Cevallos
Christian Orlando Camacho López
Esteban Sánchez
Génesis Mayerli Rivadeneira Mendoza
Mario Patricio Bermeo Orozco
Lorena Geselle Duque Cruz
Estefania Suárez
Carlos Rubio Mera
Yadira Cristina Solórzano Shilquigua
Alex H. Tirira P.
Andrés Palma
Mayra Ñaupari
María Fernanda Nieto Trujillo
Selene Osorio


Actividades diarias realizadas

Día 1: Propuesta temática seleccionada y motivaciones
Día 2: Fallas encontradas (data, metadata, diccionario
Día 3: Conjunto de datos seleccionado y razones
Día 4: Preguntas a los datos y recomendaciones
Día 5: Cuenta tu historia

1 me gusta

Hola que tal.
Les invitamos a los participantes de este equipo a interactuar por aquí. Pueden presentarse indicando por ejemplo: su especialidad, intereses, de qué universidad y carrera son, etc.

Un abrazo.

1 me gusta

Seleccionar la línea temática a trabajar.
Educación

Revisar qué conjuntos de datos existen de la temática elegida.

Registro de títulos
Ser Bachiller
Descomposición de la matrícula MINEDUC
Encuesta Nacional Multipropósito de Hogares sección educación, actividad física y tecnologías de la información y comunicación
Ser Estudiante
Becas
MEF: Ejecución de Nóminas 2022/marzo
MEF: Ejecución de Nóminas 2022/abril
MEF Ejecución de Nóminas 2021/Agosto
Ejecución de Nóminas 2021/Septiembre
Registro de Matrícula - MINEDUC
INEVAL

Publicar los avances de este día.

Los datos correspondientes a Registro de instituciones, estudiantes y docentes levantados por periodo escolar, pertenecen al Grupo de Educación y contiene gran cantidad de datos que pueden ser valiosos para desarrollar varios análisis como:
1.- Análisis socio - económico para definir costos en los cursos que otorga la universidad.
2.- Análisis para planteamiento de cursos con temáticas para el desarrollo del personal docente y administrativo de las unidades educativas.
3.- Análisis de remuneraciones para evidenciar las carreras académicas que proyectan mayor redito monetario
4.- Análisis para determinar que .areas de conocimiento se requiere reforzar dentro de las mallas curriculares educativas
5.- Análisis del impacto que tiene la mujer en los ámbitos laborales y de educación

Estimados compañeros a continuación presento una propuesta sobre la actividad del día 2, tomando como base que para estudiar los datos,
primero se debe establecer el objetivo de estudio o que es lo que se desea analizar:

Antecedente

En todo el mundo, sólo el 33 % del personal de investigación está compuesto por mujeres.
Además, reciben menos fondos de investigación que los hombres, y tienen menos probabilidades de lograr un ascenso.
En el sector privado se observa una situación similar, las mujeres ocupan menos cargos directivos
en las empresas y puestos técnicos en las industrias tecnológicas. Las mujeres representan tan sólo
el 22 % de las y los profesionales que trabajan en el campo de la inteligencia artificial y el 28 %
de las personas graduadas en ingeniería. Esta evidente subrepresentación de las mujeres limita nuestra
capacidad para encontrar soluciones sostenibles e inclusivas a los problemas modernos y construir
una mejor sociedad para todas las personas. (https://ecuador.unwomen.org/es/en-la-mira-dia-internacional-de-las-mujeres-y-las-ninas-en-la-ciencia-2022)

En referencia a este antecedente deseo conocer como se encuentra la población femenina del país
con respecto a la ciencia y la tecnología, especificamente cual es la incidencia de las mujeres en el
país en el ambiente de la ciencia y la tecnología.

Para que?
CREAR POLITICAS DE GENERO PARA QUE LAS MUJERES TENGAN MAYOR ACCESIBILIDAD A LOS AMBITOS LABORAL Y DE EDUCACION

Cuáles son esos 3 conjuntos de datos que seleccionaste para la detección de fallos.

Para el analisis se ha buscado información dentro del portal de datos abiertos del país y el Sistema Nacional de Información de Educación Superior del Ecuador,
no se encuentra mucha información pero se ha escogido los siguientes datos del portal de datos abiertos que nos puede ayudar:

Registro de Títulos - Octubre 2021
INEVAL_serbachiller20_2021Noviembre
MINEDUC_RegistroAdministrativoHistorico_2009-2021Inicio
SENESCYT_Becas_2021Septiembe

En un párrafo cuéntanos qué defectos encontraste en la metadata y/o el diccionario de datos de esos 3 conjuntos de datos.
Metadata

MINEDUC_RegistroAdministrativoHistorico_2009-2021Inicio
Dentro de los metadatos existe un itém de la DESCRIPCIÓN , en donde no se específica en forma clara cuales son los datos que
se encuentran dentro de los datasets presentados por la institución.
SENESCYT_Becas_2021Septiembe
Se encuentra mal ingresado la información en los itéms, en el item codigo de la institución esta la URL en cambio en la URL no se encuentra información

FORMA GENERAL
Los metadatas que se encuentren dentro del portal deben tener estandarizados los items , en base a que algunos presentan 24 items y otros
tan solo 15

Diccionario de datos
FORMA GENERAL
Dentro del Diccionario de datos se requiere mayor explicación en la descripción de cada campos

Cuál de esos 3 conjuntos de datos requieren proceso de limpieza. Cuéntanos un poco sobre qué campos/columnas contienen basura, y de qué tipo.
campos/columnas contienen basura, y de qué tipo

Registro de Títulos - Octubre 2021
ProfesiOn/Especialidad → Datos incorrectos, falta estandarizar las profesiones
Nivel del TItulo —> Dato incorrectos, existe un caracter especial en los datos
SEXO–>Datos vacíos

SENESCYT_Becas_2021Septiembe
TIPO DISCAPACIDAD y PORCENTAJE DISCAPACIDAD—>Falta Estandarizar los datos en base al CAMPO DE DISCAPACIDAD
TIPO DISCAPACIDAD y PORCENTAJE DISCAPACIDAD—>Existe como dato un caracter especial “-” , que puede entenderse como vacío
CONVOCATORIA —>Existe como dato un caracter especial “-” , que puede entenderse como vacío, aunque no puede estar vacío ya que debe existir una convocatoria
AÑO SUSCRIPCIÓN —> Existe como dato el valor NO REGISTRADO, el mismo que no indica el AÑO

INEVAL_serbachiller20_2021Noviembre
quintil,fac_exp,isec,inev,imat,ilyl,icn,ies,nl_inev,nl_imat,nl_ilyl,nl_icn,nl_ies —> tiene el valor 999999