Día 3: Conjunto de datos seleccionado y razones (E4)

Este espacio está dedicado para compartir los avances de las actividades de este día.

Sobre las actividades, te dejamos una guía a continuación:

Para compartir los avances, cuéntanos lo siguiente:

  • Cuáles son esos conjuntos de datos afortunadas que seleccionaste para trabajar.
  • Los conjuntos de datos seleccionados ¿necesitaron del proceso de limpieza? Cuéntanos cómo realizaste el proceso de limpieza, si conocías una herramienta para ello, o si utilizaste alguna recomendada en la mentoría. Comparte esa experiencia en un párrafo.

Marca el check :white_check_mark: cuando hayas realizado la actividad.

Se seleccionada la base de datos Defunciones Generales al año 2020 por los siguientes motivos:

  1. Existe una gran variedad de datos con diferentes escalas de medicion siendo posible realizar un analisis exploratorio de datos “EDA” para obtener una visualizacion claro del conjunto a trabajar para plantearse preguntas al respecto.

  2. No se realizo un proceso de limpieza dado que imputar información sobre los registros de defunción requiere una metodología y un marco teorica estudiado que sustente la misma.

  3. Se puede utilizar diferentes softwares estadistico como R, python, spss , stata , excel para realizar los trabajos de limpieza y descripcion de los datos.

4 Me gusta