Entradas

Mostrando las entradas con la etiqueta Data Science

📊 Cómo Analicé 10 Años de Divorcios en México con Python ¡Y cómo puedes hacerlo tú!

Imagen
 ¿Alguna vez te has preguntado qué estados de México tienen las tasas de divorcio más altas? Como analista de datos, decidí sumergirme en los microdatos del INEGI y los resultados son fascinantes. En este post, te muestro cómo logré consolidar más de 9 datasets complejos, normalizar la información por cada 1,000 habitantes y crear un Mapa Interactivo Profesional que permite explorar los datos con un solo clic. ¿Qué aprenderás con este proyecto? Consolidación Masiva: Cómo leer múltiples archivos CSV de una carpeta automáticamente. Limpieza de Datos Reales: Solución definitiva a errores de codificación (UTF-8 vs Latin1) y cruce de catálogos del INEGI. Visualización Geoespacial: Uso de Folium para crear mapas de calor (Choropleth) con popups interactivos. ¿Quieres ahorrarte horas de depuración y código? He preparado este Jupyter Notebook profesional , totalmente documentado y listo para ejecutar. Es ideal para estudiantes de ciencia de datos, periodistas o curiosos de la estadíst...

📊 Cómo Analicé 10 Años de Divorcios en México con Python ¡Y cómo puedes hacerlo tú!

Imagen
 ¿Alguna vez te has preguntado qué estados de México tienen las tasas de divorcio más altas? Como analista de datos, decidí sumergirme en los microdatos del INEGI y los resultados son fascinantes. En este post, te muestro cómo logré consolidar más de 9 datasets complejos, normalizar la información por cada 1,000 habitantes y crear un Mapa Interactivo Profesional que permite explorar los datos con un solo clic. ¿Qué aprenderás con este proyecto? Consolidación Masiva: Cómo leer múltiples archivos CSV de una carpeta automáticamente. Limpieza de Datos Reales: Solución definitiva a errores de codificación (UTF-8 vs Latin1) y cruce de catálogos del INEGI. Visualización Geoespacial: Uso de Folium para crear mapas de calor (Choropleth) con popups interactivos. ¿Quieres ahorrarte horas de depuración y código? He preparado este Jupyter Notebook profesional , totalmente documentado y listo para ejecutar. Es ideal para estudiantes de ciencia de datos, periodistas o curiosos de la estadíst...

Ejemplo Análisis de datos con Python, Jupyter. Datasciense de divorcios en México

Imagen
Los divorcios son un fenómeno social que refleja cambios en la estructura familiar y las dinámicas de pareja en México. Analizar estos datos nos permite entender patrones, tendencias y diferencias según el sexo de los integrantes, duración del matrimonio y otras variables relevantes. En este artículo, exploraremos un conjunto de datos oficiales sobre divorcios en México utilizando Python y Jupyter Notebook. A través de limpieza de datos, visualizaciones y análisis estadístico, obtendremos conclusiones que nos ayudan a comprender mejor la dinámica de estos eventos. A continuación, describo los pasos que seguí para realizar este análisis de manera clara y estructurada: Obtener los datos de una fuente oficial Analizar la información descargada  Leer los datos con Panda Limpiar Datos Hacer análisis con graficas Generar una descripción de estas gráficas para obtener algunas conclusiones Las Herramientas tecnológicas que vamos a utilizar son Python Jupyter  Matplotlib seaborn ...

Data Science & Copilot: Explorando Datos de Salud en México

Imagen
En México, el Instituto Nacional de Estadística y Geografía (INEGI) pone a nuestra disposición una vasta cantidad de datos abiertos sobre salud pública. Estos conjuntos de datos representan una mina de oro para la investigación, pero a menudo, su análisis inicial puede ser un proceso largo y laborioso. ⏳ Aquí es donde entra en juego la tecnología de los Grandes Modelos de Lenguaje (LLMs) . ¿Qué pasaría si una IA pudiera actuar como un verdadero copiloto en este proceso, ayudándonos a explorar estos datos y a descubrir patrones de forma más rápida y eficiente? En este post, vamos a ver cómo una herramienta como Copilot puede acelerar la investigación en salud y la ciencia de datos, y por qué se está convirtiendo en un aliado indispensable para los data scientists. Sobre el dataset Para este ejercicio, vamos a usar un dataset público del INEGI que contiene información valiosa sobre temas de salud. Estos datos son cruciales para entender la demografía, la prevalencia de enfermeda...

🚀 Mantener este blog funcionando requiere tiempo y café. ¡Puedes contribuir con uno aquí!