Entradas

Mostrando las entradas con la etiqueta Data Science

¿Por qué algunos países prosperan y otros no? Confianza social, tecnología y desarrollo

Imagen
Confianza social, tecnología y desarrollo: ¿por qué algunos países prosperan y otros no? En los últimos años he tenido la oportunidad de visitar varios países que han marcado profundamente mi forma de ver el desarrollo económico. He estado en Japón y visité Hiroshima, una ciudad que fue destruida por una bomba atómica y que hoy es una ciudad moderna y ordenada. También visité Corea del Sur, un país que hace pocas décadas era uno de los más pobres del mundo y que hoy es líder en tecnología e innovación. Y he visto Alemania, que después de dos guerras mundiales logró reconstruirse y convertirse nuevamente en una de las economías más fuertes del mundo. Estas experiencias generan una pregunta inevitable: ¿por qué algunos países logran reconstruirse y prosperar incluso después de enormes crisis, mientras que otras regiones con grandes recursos naturales siguen enfrentando dificultades para desarrollarse? Una posible respuesta está en un concepto muy estudiado en economía...

📊 Cómo Analicé 10 Años de Divorcios en México con Python ¡Y cómo puedes hacerlo tú!

Imagen
Análisis de divorcios en México con Python y datos del INEGI (Proyecto real de Ciencia de Datos) ¿Alguna vez te has preguntado qué estados de México tienen las tasas de divorcio más altas y cómo analizarlo con datos reales? En este proyecto práctico de Ciencia de Datos con Python , trabajé directamente con microdatos oficiales del INEGI para responder esa pregunta. El resultado es un mapa interactivo profesional que permite explorar visualmente los divorcios en México, normalizados por cada 1,000 habitantes , usando herramientas reales que se utilizan en el mundo laboral. ¿Qué aprenderás con este proyecto? Consolidación masiva de datos: lectura automática de más de 9 archivos CSV desde una carpeta. Limpieza de datos reales: solución a errores de codificación (UTF-8 vs Latin1) y cruces con catálogos oficiales del INEGI. Análisis estadístico: normalización de tasas por población para comparaciones correctas entre estados. Visualización geoespacial: creación d...

Ejemplo Análisis de datos con Python, Jupyter. Datasciense de divorcios en México

Imagen
Los divorcios son un fenómeno social que refleja cambios en la estructura familiar y las dinámicas de pareja en México. Analizar estos datos nos permite entender patrones, tendencias y diferencias según el sexo de los integrantes, duración del matrimonio y otras variables relevantes. En este artículo, exploraremos un conjunto de datos oficiales sobre divorcios en México utilizando Python y Jupyter Notebook. A través de limpieza de datos, visualizaciones y análisis estadístico, obtendremos conclusiones que nos ayudan a comprender mejor la dinámica de estos eventos. A continuación, describo los pasos que seguí para realizar este análisis de manera clara y estructurada: Obtener los datos de una fuente oficial Analizar la información descargada  Leer los datos con Panda Limpiar Datos Hacer análisis con graficas Generar una descripción de estas gráficas para obtener algunas conclusiones Las Herramientas tecnológicas que vamos a utilizar son Python Jupyter  Matplotlib seaborn ...

Data Science & Copilot: Explorando Datos de Salud en México

Imagen
En México, el Instituto Nacional de Estadística y Geografía (INEGI) pone a nuestra disposición una vasta cantidad de datos abiertos sobre salud pública. Estos conjuntos de datos representan una mina de oro para la investigación, pero a menudo, su análisis inicial puede ser un proceso largo y laborioso. ⏳ Aquí es donde entra en juego la tecnología de los Grandes Modelos de Lenguaje (LLMs) . ¿Qué pasaría si una IA pudiera actuar como un verdadero copiloto en este proceso, ayudándonos a explorar estos datos y a descubrir patrones de forma más rápida y eficiente? En este post, vamos a ver cómo una herramienta como Copilot puede acelerar la investigación en salud y la ciencia de datos, y por qué se está convirtiendo en un aliado indispensable para los data scientists. Sobre el dataset Para este ejercicio, vamos a usar un dataset público del INEGI que contiene información valiosa sobre temas de salud. Estos datos son cruciales para entender la demografía, la prevalencia de enfermeda...

🚀 Mantener este blog funcionando requiere tiempo y café. ¡Puedes contribuir con uno aquí!