Entradas

Mostrando las entradas con la etiqueta Data Science

Dashboard de Tenis en Tiempo Real con WebSocket y JavaScript

Imagen
¿Por qué utilizar WebSocket en lugar de una API REST? El caso de Tennis API Cuando trabajamos con APIs, normalmente pensamos en solicitudes HTTP tradicionales donde una aplicación consulta información cada cierto tiempo. Sin embargo, para aplicaciones que requieren datos en tiempo real, existe una alternativa mucho más eficiente: WebSocket. Mientras exploraba las capacidades de Tennis API encontré su integración mediante Socket.IO, una tecnología que permite recibir actualizaciones en tiempo real sin necesidad de realizar consultas constantes al servidor. ¿Cómo funciona una API REST tradicional? Con una API REST, la aplicación debe preguntar periódicamente si existen nuevos datos. Por ejemplo: setInterval(async () => { const response = await fetch("/live-scores"); const data = await response.json(); console.log(data); }, 5000); En este caso la aplicación realiza una consulta cada 5 segundos. El problema es que muchas veces no existe información nue...

Análisis del Top 100 ATP con Python y Tennis API | Datos Históricos por Superficie

Imagen
Análisis del Top 100 ATP con Python y Tennis API: ¿Quién domina cada superficie? Los datos deportivos son una excelente forma de aprender análisis de datos y visualización con Python. En este artículo exploramos el rendimiento histórico del Top 100 ATP actual utilizando la Tennis API , una plataforma que ofrece acceso a rankings, perfiles de jugadores, resultados en vivo, estadísticas históricas y mucho más. Nuestro objetivo fue responder una pregunta sencilla: ¿Quiénes son los mejores jugadores del Top 100 ATP actual en cada superficie? Para ello utilizamos Python, Pandas y Plotly para analizar más de 3,700 registros históricos obtenidos desde la API desde 2004 a 2026 para el top100 . Obtención de datos con Tennis API La información fue obtenida utilizando el endpoint Surface Summary disponible en la documentación oficial de Tennis API. Documentación: https://tennisapidoc.matchstat.com/ Sitio oficial: https://tennis-api.com/ El proceso consistió en: Obte...

📊 Cómo Analicé 10 Años de Divorcios en México con Python ¡Y cómo puedes hacerlo tú!

Imagen
Análisis de divorcios en México con Python y datos del INEGI (Proyecto real de Ciencia de Datos) ¿Alguna vez te has preguntado qué estados de México tienen las tasas de divorcio más altas y cómo analizarlo con datos reales? En este proyecto práctico de Ciencia de Datos con Python , trabajé directamente con microdatos oficiales del INEGI para responder esa pregunta. El resultado es un mapa interactivo profesional que permite explorar visualmente los divorcios en México, normalizados por cada 1,000 habitantes , usando herramientas reales que se utilizan en el mundo laboral. ¿Qué aprenderás con este proyecto? Consolidación masiva de datos: lectura automática de más de 9 archivos CSV desde una carpeta. Limpieza de datos reales: solución a errores de codificación (UTF-8 vs Latin1) y cruces con catálogos oficiales del INEGI. Análisis estadístico: normalización de tasas por población para comparaciones correctas entre estados. Visualización geoespacial: creación d...

Ejemplo Análisis de datos con Python, Jupyter. Datasciense de divorcios en México

Imagen
Los divorcios son un fenómeno social que refleja cambios en la estructura familiar y las dinámicas de pareja en México. Analizar estos datos nos permite entender patrones, tendencias y diferencias según el sexo de los integrantes, duración del matrimonio y otras variables relevantes. En este artículo, exploraremos un conjunto de datos oficiales sobre divorcios en México utilizando Python y Jupyter Notebook. A través de limpieza de datos, visualizaciones y análisis estadístico, obtendremos conclusiones que nos ayudan a comprender mejor la dinámica de estos eventos. A continuación, describo los pasos que seguí para realizar este análisis de manera clara y estructurada: Obtener los datos de una fuente oficial Analizar la información descargada  Leer los datos con Panda Limpiar Datos Hacer análisis con graficas Generar una descripción de estas gráficas para obtener algunas conclusiones Las Herramientas tecnológicas que vamos a utilizar son Python Jupyter  Matplotlib seaborn ...

Data Science & Copilot: Explorando Datos de Salud en México

Imagen
En México, el Instituto Nacional de Estadística y Geografía (INEGI) pone a nuestra disposición una vasta cantidad de datos abiertos sobre salud pública. Estos conjuntos de datos representan una mina de oro para la investigación, pero a menudo, su análisis inicial puede ser un proceso largo y laborioso. ⏳ Aquí es donde entra en juego la tecnología de los Grandes Modelos de Lenguaje (LLMs) . ¿Qué pasaría si una IA pudiera actuar como un verdadero copiloto en este proceso, ayudándonos a explorar estos datos y a descubrir patrones de forma más rápida y eficiente? En este post, vamos a ver cómo una herramienta como Copilot puede acelerar la investigación en salud y la ciencia de datos, y por qué se está convirtiendo en un aliado indispensable para los data scientists. Sobre el dataset Para este ejercicio, vamos a usar un dataset público del INEGI que contiene información valiosa sobre temas de salud. Estos datos son cruciales para entender la demografía, la prevalencia de enfermeda...

🚀 Mantener este blog funcionando requiere tiempo y café. ¡Puedes contribuir con uno aquí!