Entradas

Mostrando las entradas con la etiqueta Análisis de Datos

📊 Cómo Analicé 10 Años de Divorcios en México con Python ¡Y cómo puedes hacerlo tú!

Imagen
 ¿Alguna vez te has preguntado qué estados de México tienen las tasas de divorcio más altas? Como analista de datos, decidí sumergirme en los microdatos del INEGI y los resultados son fascinantes. En este post, te muestro cómo logré consolidar más de 9 datasets complejos, normalizar la información por cada 1,000 habitantes y crear un Mapa Interactivo Profesional que permite explorar los datos con un solo clic. ¿Qué aprenderás con este proyecto? Consolidación Masiva: Cómo leer múltiples archivos CSV de una carpeta automáticamente. Limpieza de Datos Reales: Solución definitiva a errores de codificación (UTF-8 vs Latin1) y cruce de catálogos del INEGI. Visualización Geoespacial: Uso de Folium para crear mapas de calor (Choropleth) con popups interactivos. ¿Quieres ahorrarte horas de depuración y código? He preparado este Jupyter Notebook profesional , totalmente documentado y listo para ejecutar. Es ideal para estudiantes de ciencia de datos, periodistas o curiosos de la estadíst...

Radiografía del Matrimonio en México: Un Análisis de Datos con Python (2018-2024)

Imagen
  Introducción El matrimonio, más allá de ser un vínculo afectivo, es un acto jurídico que genera datos valiosos para entender la evolución de la sociedad mexicana. Tras analizar los divorcios en mi artículo anterior te comparto la liga Análisis divorcios en México , surge una pregunta obligada: ¿Cómo se están comportando las uniones en nuestro país? En este post, utilizaremos Python y Jupyter Notebook para explorar el conjunto de datos oficiales del INEGI. A través de la limpieza de datos y visualizaciones, identificaremos tendencias, cambios generacionales y el impacto de factores externos en la formalización de estas uniones. Metodología: El Camino de los Datos Para obtener resultados confiables, seguí una estructura de trabajo clara: Extracción: Obtención de microdatos desde el portal oficial del INEGI. Exploración (EDA): Análisis previo de la estructura de los archivos comprimidos. Procesamiento: Lectura y limpieza profunda con la librería Pandas . Visualización: Creación...

Ejemplo Análisis de datos con Python, Jupyter. Datasciense de divorcios en México

Imagen
Los divorcios son un fenómeno social que refleja cambios en la estructura familiar y las dinámicas de pareja en México. Analizar estos datos nos permite entender patrones, tendencias y diferencias según el sexo de los integrantes, duración del matrimonio y otras variables relevantes. En este artículo, exploraremos un conjunto de datos oficiales sobre divorcios en México utilizando Python y Jupyter Notebook. A través de limpieza de datos, visualizaciones y análisis estadístico, obtendremos conclusiones que nos ayudan a comprender mejor la dinámica de estos eventos. A continuación, describo los pasos que seguí para realizar este análisis de manera clara y estructurada: Obtener los datos de una fuente oficial Analizar la información descargada  Leer los datos con Panda Limpiar Datos Hacer análisis con graficas Generar una descripción de estas gráficas para obtener algunas conclusiones Las Herramientas tecnológicas que vamos a utilizar son Python Jupyter  Matplotlib seaborn ...

Análisis con Python: ¿Cuántos reumatólogos se necesitan en Playa del Carmen?

Imagen
📊 ¿Cuántos reumatólogos se necesitan en Playa del Carmen? Un análisis con Python Las enfermedades autoinmunes afectan aproximadamente al 5% de la población mundial . Esto incluye padecimientos como lupus, artritis reumatoide, esclerosis múltiple, entre otros. En este artículo haremos un ejercicio técnico para estimar cuántos reumatólogos serían necesarios para atender esa demanda en una ciudad como Playa del Carmen, Quintana Roo , utilizando Python y Jupyter Notebook . 📌 Paso 1: Estimar población y personas afectadas De acuerdo con datos recientes, la población aproximada de Playa del Carmen es de 304,942 personas. Si el 5% sufre una enfermedad autoinmune: # Supuestos poblacion_total = 304_942 porcentaje_afectados = 0.05 personas_afectadas = poblacion_total * porcentaje_afectados print(f"Número estimado de personas con enfermedades autoinmunes: {int(personas_afectadas)}") Resultado: 15,247 personas con enfermedades autoinmunes. 📌 Paso 2: ¿Cuántos re...

Cómo Crear Gráficos con Palabras Clave en Python: Tutorial y Ejemplos Prácticos

Imagen
Quizá han visto algunos gráficos en internet o en publicidad donde podemos ver una serie de palabras ordenadas y que resaltan las palabras mas populares o mas utilizadas en un texto, si no lo han visto hablo de una imagen como la siguiente. Este tipo de diagramas pueden construirse con la ayuda de Natural Language Processing , es decir un procesador de lenguaje que es capaz de interpretar las palabras. Tenemos varias aplicaciones para el procesamiento de lenguaje natura: Como es en los chatbot En los correctores de ortografía En las aplicaciones que nos ayudan con la gramática Resultados de búsqueda en navegadores Texto predictivo en nuestros celulares o en correos Traducción de texto Análisis de datos  Hoy les quiero platicar acerca del ultima aplicación,  Análisis de Datos utilizando  Python y la librería Word Cloud para poder analizar datos y generar un diagrama como la primer imagen de esta publicación.  Para hacerlo interesante tome...

📊 Ejemplos de Python para Hacer Gráficas: Visualiza tus Datos con Matplotlib

Imagen
Como hemos visto en otras publicaciones del blog Python es un lenguaje muy amigable y con muchas librarías que permiten apoyarnos para realizar tareas de la manera más ágil. En esta ocasión quiero mostrarles como pueden hacer para mostrar datos en mapas, por ejemplo si quieren representar en el mapa de México la cantidad de universidades por cada estado y obtener una imagen como la siguiente: Tendremos que utilizar las librería   geopandas  matplotlib.pyplot   numpy   pandas  Para este ejemplo necesitamos: Instalar Jupyter ,  https://jupyter.org/install Descargar un mapa de México, yo encontré  un Github de Jon Schleuss  https://github.com/jschleuss/mexican-states Vamos a utilizar el siguiente código import geopandas as gpd import matplotlib.pyplot as plt import numpy as np import pandas as pd direccion = 'tu directorio //mexican-states-master' direccion2 = 'tu directorio\\carpeta\\' shapefile = gpd.read_file(direccion+'\mexica...

🔢 Programación en Octave: Alternativa Libre a MATLAB para Cálculo Numérico

Imagen
Si han tenido oportunidad de seguir este blog, en un post anterior platicamos acerca de Inteligencia Artificial   un curso que estoy tomando en Machine Learning y que una de las herramientas utilizadas es el curso es Octave que es  similar "Open free "de Matlab . e ¿Qué es octave? Octave es un lenguaje de programación para conocer y entender datos , es decir es un software que nos facilita el crear gráficas, realizar operaciones matemáticas simples y complejas, operaciones de álgebra lineal.  ¿Qué podemos hacer con Octave? Como por ejemplo podemos hacer análisis de capacidad en lineas de producción por medio de datos de numero de piezas producidas entre el total de tiempo ejecutado. Podemos realizar Revisión de Errores en monto contables. Podemos graficar la curva de venta de algún producto. Podemos hacer cálculos para BigData complejos creando nuestras propias funciones. Podemos analizar los datos de nuestros pacientes en un laboratorio medico para conoce...

🚀 Mantener este blog funcionando requiere tiempo y café. ¡Puedes contribuir con uno aquí!