Día 3: Conjunto de datos seleccionado y razones (E6)

Este espacio está dedicado para compartir los avances de las actividades de este día.

Sobre las actividades, te dejamos una guía a continuación:

Para compartir los avances, cuéntanos lo siguiente:

  • Cuáles son esos conjuntos de datos afortunadas que seleccionaste para trabajar.
  • Los conjuntos de datos seleccionados ¿necesitaron del proceso de limpieza? Cuéntanos cómo realizaste el proceso de limpieza, si conocías una herramienta para ello, o si utilizaste alguna recomendada en la mentoría. Comparte esa experiencia en un párrafo.

Marca el check :white_check_mark: cuando hayas realizado la actividad.

1 me gusta

Participación Danny Chiriboga:
¿Cuál es la mayor incidencia de decesos en el sector urbano con respecto al sector rural, con el fin de identificar los correctivos necesarios? Considero que esta problemática permitirá prevenir y corregir a tiempo problemas relacionados a enfermedades.

5 Me gusta

Evaluar las zonas con mayores defunciones por Alzheimer y si las zonas urbanas inciden en un mayor número de casos.

4 Me gusta
  1. En la zona urbana en comparación con la zona rural existieron más decesos en hospitales que en casa.
    Porque supondríamos que la gente del área urbana tiene más acceso a atención hospitalaria. Al contrario del área rural, en donde el mayor registro de muertes seria en sus casas
  2. ¿Fue el COVID 19 la mayor causa de muertes del 2020?
    Esto dado principalmente a las especulaciones de las personas en general
4 Me gusta

Una posible temática de investigación con las variables de la base de datos sobre defunciones.

A mayor nivel de estudios o preparacion académica se registra un menor numero de defunciones durante la pandemia (covid-19).

Variables:

Dependiente: Número de fallecidos en la pandemia.

Independiente: Nivel o grado de estudios.

Realizado por: Isaí Barrera

5 Me gusta

La frecuencia de muertes por tal enfermedad o problema de salud es mayor en la población rural que la población urbana, dicha relación entre esa mortalidad y los factores sociodemográficos podrían estar relacionados con su ocurrencia y distribución. Conocer esta información permitirá comparar las medidas preventivas realizadas en el 2020, de esta forma, comprobar si se optimizo la distribución de los recursos disponibles en ese año, con las consiguientes mejoras en la atención de la salud.

4 Me gusta

El accesos a la atención hospitalaria explica si la cantidad de defunciones es mayor en las provincias de la costa que en las provincias de la sierra
La hipótesis que se puede plantear de acuerdo a las variables y conjuntos de datos a utilizar

4 Me gusta

Las defunciones por enfermedades cardiacas, encabezan el listado de las principales causas de muerte desde el año 2020 en el país, principalmente durante la pandemia se incremento el número de muertes por esta patología en personas de 45 años o más. Según varios estudios, estas enfermedades del corazón en su mayoría dependerían de la etnia, nivel de educación y zona de residencia de las personas en el país.

4 Me gusta

Lesly López
Como incidió el área de residencial de la población ecuatoriana en fallecer en tu casa o en un hospital periodo 2020.
debido a que tenemos las variables área residencial area_res como variable dependiente y lugar de fallecimiento : lugar_ocur , edad, provincia, autopsia como variables independientes. Debido a que es un año critico por la pandemia covid 19.

3 Me gusta

Se hizo un análisis previo de todas las bases elegidas en el día 2, el conjunto de datos seleccionados para trabajar fue Registro Estadístico de Defunciones Generales 2020, dicho conjunto de datos lo seleccionamos porque dispone de variables que nos permitía hacer estudios de comparación, variables que nos generó algunas preguntas de investigación y además todas sus variables eran claras, explicitas, a diferencia de otros conjuntos de datos donde sus variables se encontraban muy complejas en su codificación. Dicho conjunto de datos fue seleccionado por el equipo en su mayoría debido a que se encuentra equilibrada en cantidad de datos, dispone de variables cualitativas que nos permiten un análisis mas profundo durante la investigación. Durante el proceso de limpieza como equipo decidimos eliminar el atributo "Vacías" dentro de la variable "PROVINCIAS", pues se consideró que no era útil trabajar con datos que no recogían información de la provincia de origen de las personas, pues gran parte de los cuestionamientos que se generaron por los integrantes del equipo, partían de dicha variable, luego de ello, decidimos también eliminar el atributo Sin información de la variable EDAD, ya que, es una variable clave para todas las problemáticas generadas por el equipo. Mediante Excel y R, realizamos dicha limpieza del conjunto de datos.

1 me gusta

Las variables dentro de la base de datos nos hizo pensar varias preguntas dentro del grupo generando así temas específicos para evaluar como en mi caso: ¿ Cual fue la causa principal de muerte en las personas en el año 2020? ¿ En que zona rural o urbana se registraron mas muertes? ¿ Fueron mas hombres o mujeres los que murieron durante el 2020?

2 Me gusta