Data Science & Copilot: Explorando Datos de Salud en México

Imagen
En México, el Instituto Nacional de Estadística y Geografía (INEGI) pone a nuestra disposición una vasta cantidad de datos abiertos sobre salud pública. Estos conjuntos de datos representan una mina de oro para la investigación, pero a menudo, su análisis inicial puede ser un proceso largo y laborioso. ⏳ Aquí es donde entra en juego la tecnología de los Grandes Modelos de Lenguaje (LLMs) . ¿Qué pasaría si una IA pudiera actuar como un verdadero copiloto en este proceso, ayudándonos a explorar estos datos y a descubrir patrones de forma más rápida y eficiente? En este post, vamos a ver cómo una herramienta como Copilot puede acelerar la investigación en salud y la ciencia de datos, y por qué se está convirtiendo en un aliado indispensable para los data scientists. Sobre el dataset Para este ejercicio, vamos a usar un dataset público del INEGI que contiene información valiosa sobre temas de salud. Estos datos son cruciales para entender la demografía, la prevalencia de enfermeda...

Dónde Encontrar Datasets para Practicar Python: Mejores Fuentes y Recursos

 Obtener datasets interesantes y relevantes es fundamental para practicar con Python. Aquí tienes algunas fuentes donde puedes encontrar datasets de calidad:



1. Kaggle:

   - Kaggle ofrece una vasta colección de datasets gratuitos y es conocida por sus competencias de ciencia de datos. Puedes explorar los datasets públicos y usarlos en tus propios desafíos.

  https://www.kaggle.com/datasets


2. UCI Machine Learning Repository:

   - Este repositorio ofrece una amplia variedad de datasets utilizados en la comunidad académica y de investigación.

   - https://archive.ics.uci.edu/ml/index.php


3. Google Dataset Search:

   - Una herramienta de búsqueda específica para datasets, que permite encontrar datos de diferentes fuentes y dominios.

   - https://datasetsearch.research.google.com/


4. Data.gov:

   - Portal de datos abiertos del gobierno de EE.UU. que ofrece acceso a miles de datasets públicos en diversas áreas como salud, medio ambiente, educación, y más.

   - https://www.data.gov/


5. Awesome Public Datasets:

   - Una colección de datasets públicos curada por la comunidad, que abarca una amplia variedad de temas y fuentes.

   - https://github.com/awesomedata/awesome-public-datasets


6. AWS Public Datasets:

   - Amazon Web Services ofrece una colección de datasets públicos que se pueden utilizar directamente en la nube.

   - https://registry.opendata.aws/


7. Data World:

   - Plataforma colaborativa donde los usuarios pueden encontrar, crear y compartir datasets de una amplia gama de categorías.

   - https://data.world/


8. FiveThirtyEight:

   - Ofrece datasets utilizados en sus artículos de periodismo de datos, abarcando temas como política, deportes, y economía.

   - https://data.fivethirtyeight.com/


9. Quandl:

   - Ofrece acceso a datasets financieros y económicos, algunos de los cuales son gratuitos.

   - https://www.quandl.com/



También les comparto un ejemplo de análisis de un dataset 

https://www.programacionparatodos.com/2025/06/analisis-de-datos-clinicos-con-python.html


Comentarios

🚀 Mantener este blog funcionando requiere tiempo y café. ¡Puedes contribuir con uno aquí!

Entradas más populares de este blog

Guía Práctica: Ejemplo Completo de ASPX para Desarrolladores Web

📊 Automatiza tu trabajo: Convierte tablas de Word a Excel con una macro

API de banxico para obtener tipo de cambio utilizando Javascript