Saltar a contenido

馃殌 Exploraciones Extra: Investigando + Datasets

馃搳 An谩lisis Complementarios con Datasets Alternativos

Prop贸sito

Esta secci贸n presenta exploraciones adicionales con datasets alternativos.


4
Exploraciones
Completadas
16
Visualizaciones
Generadas

Proyectos de Exploraci贸n

馃嵎 An谩lisis del Wine Quality Dataset

Dataset: Wine Quality (UCI ML Repository) - 1,599 muestras de vino tinto con 11 variables fisicoqu铆micas y una variable objetivo de calidad (3-8). Incluye propiedades como acidez, alcohol, sulfatos y densidad que determinan la calidad del vino.

Enfoque: An谩lisis exploratorio completo aplicando t茅cnicas EDA para identificar patrones fisicoqu铆micos que influyen en la calidad del vino.

馃彔 Missing Data Detective - California Housing

Dataset: California Housing (Scikit-learn) - 20,640 muestras de viviendas en California (1990) con 8 variables inmobiliarias. Incluye ingreso mediano, edad de viviendas, n煤mero de habitaciones, poblaci贸n y ubicaci贸n geogr谩fica.

Enfoque: An谩lisis forense de datos faltantes y outliers aplicando t茅cnicas de calidad de datos con consideraciones 茅ticas. Se comenz贸 a utilizar el dataset de Boston Housing, pero a mitad del an谩lisis se encontr贸 documentaci贸n que inclu铆a problemas 茅ticos en dicho dataset (asunciones sobre segregaci贸n racial).

馃彞 Feature Scaling & Anti-Leakage Pipeline - Heart Disease

Dataset: Heart Disease (UCI ML Repository) - 297 registros de pacientes con 13 variables m茅dicas. Incluye edad, colesterol, presi贸n arterial, frecuencia card铆aca y otros indicadores m茅dicos para predicci贸n de enfermedad card铆aca.

Enfoque: Replicaci贸n del proyecto de Feature Scaling aplicando t茅cnicas de escalado (StandardScaler, MinMaxScaler, RobustScaler) y experimento cr铆tico de data leakage con datos m茅dicos reales.

馃挸 Feature Importance Analysis - Credit Card Fraud

Dataset: Credit Card Fraud Detection (Kaggle/UCI ML Repository) - 284,807 transacciones con 30 variables financieras. Incluye 28 features anonimizadas (V1-V28), Amount, Time y Class para detecci贸n de fraude en tarjetas de cr茅dito.

Enfoque: Replicaci贸n del an谩lisis de importancia de features aplicando Mutual Information y Random Forest con SMOTE para manejar el desbalance extremo (0.172% de fraude) en datos financieros.