Entradas

Mostrando las entradas con la etiqueta Ciencia de Datos

Data Science & Copilot: Explorando Datos de Salud en México

Imagen
En México, el Instituto Nacional de Estadística y Geografía (INEGI) pone a nuestra disposición una vasta cantidad de datos abiertos sobre salud pública. Estos conjuntos de datos representan una mina de oro para la investigación, pero a menudo, su análisis inicial puede ser un proceso largo y laborioso. ⏳ Aquí es donde entra en juego la tecnología de los Grandes Modelos de Lenguaje (LLMs) . ¿Qué pasaría si una IA pudiera actuar como un verdadero copiloto en este proceso, ayudándonos a explorar estos datos y a descubrir patrones de forma más rápida y eficiente? En este post, vamos a ver cómo una herramienta como Copilot puede acelerar la investigación en salud y la ciencia de datos, y por qué se está convirtiendo en un aliado indispensable para los data scientists. Sobre el dataset Para este ejercicio, vamos a usar un dataset público del INEGI que contiene información valiosa sobre temas de salud. Estos datos son cruciales para entender la demografía, la prevalencia de enfermeda...

Análisis de redes sociales con minería de datos: ¿Quién usa qué plataforma?

Imagen
Análisis Demográfico de las Redes Sociales: Un Enfoque desde la Ciencia de Datos En la era digital, las redes sociales se han convertido en una fuente masiva de datos útiles para entender comportamientos humanos, segmentar audiencias y tomar decisiones estratégicas. Desde la perspectiva de la minería de datos y la ciencia de datos (data science), analizar los patrones demográficos de plataformas como Facebook, Instagram o TikTok ofrece un terreno fértil para extraer conocimiento. ¿Quién usa qué red social? Los datos más recientes sobre la distribución por género en redes sociales revelan patrones interesantes: Facebook : Con más de 3 mil millones de usuarios activos mensuales, es la red social más usada del mundo. Tiene una distribución bastante equilibrada: aproximadamente 51% mujeres y 49% hombres. Pinterest : Predominantemente femenina, con alrededor del 76% de sus usuarios identificados como mujeres. Reddit : Mayoritariamente masculina, con 63.6% hombres y 35.1% mujeres...

Dónde Encontrar Datasets para Practicar Python: Mejores Fuentes y Recursos

Imagen
 Obtener datasets interesantes y relevantes es fundamental para practicar con Python. Aquí tienes algunas fuentes donde puedes encontrar datasets de calidad: 1. Kaggle:    - Kaggle ofrece una vasta colección de datasets gratuitos y es conocida por sus competencias de ciencia de datos. Puedes explorar los datasets públicos y usarlos en tus propios desafíos.   https://www.kaggle.com/datasets 2. UCI Machine Learning Repository:    - Este repositorio ofrece una amplia variedad de datasets utilizados en la comunidad académica y de investigación.    - https://archive.ics.uci.edu/ml/index.php 3. Google Dataset Search:    - Una herramienta de búsqueda específica para datasets, que permite encontrar datos de diferentes fuentes y dominios.    - https://datasetsearch.research.google.com/ 4. Data.gov:    - Portal de datos abiertos del gobierno de EE.UU. que ofrece acceso a miles de datasets públicos en diversas áreas como salud, ...

🚀 Mantener este blog funcionando requiere tiempo y café. ¡Puedes contribuir con uno aquí!