Data Science & Copilot: Explorando Datos de Salud en México

En México, el Instituto Nacional de Estadística y Geografía (INEGI) pone a nuestra disposición una vasta cantidad de datos abiertos sobre salud pública. Estos conjuntos de datos representan una mina de oro para la investigación, pero a menudo, su análisis inicial puede ser un proceso largo y laborioso. ⏳

Aquí es donde entra en juego la tecnología de los Grandes Modelos de Lenguaje (LLMs). ¿Qué pasaría si una IA pudiera actuar como un verdadero copiloto en este proceso, ayudándonos a explorar estos datos y a descubrir patrones de forma más rápida y eficiente? En este post, vamos a ver cómo una herramienta como Copilot puede acelerar la investigación en salud y la ciencia de datos, y por qué se está convirtiendo en un aliado indispensable para los data scientists.


Sobre el dataset

Para este ejercicio, vamos a usar un dataset público del INEGI que contiene información valiosa sobre temas de salud. Estos datos son cruciales para entender la demografía, la prevalencia de enfermedades y otros indicadores sanitarios que influyen directamente en las políticas públicas. Como puedes ver en la imagen, estos datos son accesibles para todos.



Aquí puedes encontrar y descargar el dataset en la página oficial del INEGI.


Copilot en acción (con imágenes)

Aquí te muestro cómo Copilot puede transformar el análisis exploratorio de datos, ahorrando tiempo y esfuerzo.

Paso 1: Carga y entendimiento de los datos

La primera interacción con Copilot es clave. Simplemente le pedimos que nos ayude a analizar el dataset que le proporcionamos.



La conversación comienza de forma natural, como si habláramos con un colega.

Copilot nos muestra un resumen del dataset, incluyendo el tipo de archivo y el periodo cubierto, lo cual nos ahorra tiempo valioso de exploración manual.





A continuación, Copilot nos describe la estructura del dataset, detallando cada campo (identificadores y métricas). Esto es fundamental para entender los datos sin tener que leer un manual extenso.


Copilot también nos da un análisis de las características del dataset y sugiere posibles usos, como el análisis de desempeño o la identificación de patrones.


Nos ofrece diferentes tipos de análisis que puede realizar, como visualizar municipios con mayor actividad o comparar datos planeados versus ejecutados.



Paso 2: Análisis detallado por municipio

Al ver la utilidad, le pedimos un análisis más profundo. Le pedimos a Copilot que nos ayude a analizar un municipio específico, como Monterrey.



Copilot nos pide el nombre o el código del municipio.

Después de confirmar, Copilot nos ofrece un análisis detallado de la distribución de actividad por tipo de servicio.

Análisis detallado por municipio en Copilot.

Aquí vemos un ejemplo claro de cómo Copilot nos muestra los servicios con mayor volumen de actividad.



Paso 3: Visualizaciones y Top Rankings

La visualización de datos es clave para encontrar patrones. Le pedimos a Copilot que nos muestre los procedimientos más realizados y las distribuciones demográficas.

Copilot nos proporciona el "Top 20" de procedimientos médicos realizados en 2024, con un ranking claro y conciso.



Inmediatamente, Copilot nos proporciona un insight clave para una junta médica:

Los procedimientos más realizados en 2024 fueron medicina de diagnóstico y análisis clínicos, representando juntos más del 80% del total.



La herramienta también nos muestra la distribución de procedimientos, como la endoscopia, agrupados por tamaño de localidad, lo que nos ayuda a entender el contexto demográfico.


Una vez más, Copilot nos entrega un insight relevante:

La mayoría de los procedimientos de endoscopia se concentran en localidades con más de 100,000 habitantes, lo que indica una fuerte correlación entre densidad poblacional y demanda de servicios especializados.



Para complementar, Copilot nos presenta una visualización alternativa de la actividad por tamaño de localidad en Monterrey, confirmando el patrón.

Copilot también puede realizar comparaciones avanzadas, como los valores planeados vs. ejecutados, una métrica crucial para la gestión y asignación de recursos.



Lo que aporta un LLM al análisis de datos

La verdadera ventaja de usar una herramienta como Copilot no es solo que nos da código, sino que acelera el proceso de prototipado y nos permite pasar de la idea a la visualización de un insight en cuestión de minutos.

Copilot actúa como un verdadero copiloto. No sustituye la experiencia, el pensamiento crítico y la interpretación humana del data scientist, sino que la complementa. Libera al experto de las tareas repetitivas de codificación y le permite enfocarse en lo que realmente importa: formular las preguntas correctas y interpretar los resultados. Es la perfecta sinergia entre la velocidad de la IA y la profundidad del conocimiento humano.


Reflexiones finales

El uso de LLMs en el análisis de datos de salud tiene un potencial enorme. Desde la salud informática hasta la epidemiología, estas herramientas pueden democratizar el acceso al análisis de datos, permitiendo a más investigadores, estudiantes y profesionales explorar la información pública de una manera más ágil y eficiente. Es una oportunidad para la investigación y la docencia en la era digital.


Llamada a la acción (CTA)

Si trabajas en ciencia de datos, salud o en proyectos con LLMs, cuéntanos tu experiencia. ¿Cómo crees que estas herramientas pueden transformar el futuro de la investigación? ¡Déjanos tu comentario! 👇

#DataScience #SaludDigital #LLM #Copilot #OpenData





Comentarios

🚀 Mantener este blog funcionando requiere tiempo y café. ¡Puedes contribuir con uno aquí!

Entradas más populares de este blog

Guía Práctica: Ejemplo Completo de ASPX para Desarrolladores Web

📊 Automatiza tu trabajo: Convierte tablas de Word a Excel con una macro

API de banxico para obtener tipo de cambio utilizando Javascript