Inmersión DatosClase 02 - Construcción, Evaluación y selección del mejor modelo
Clase 02 - Construcción, Evaluación y selección del mejor modelo
Participa y entra más a fondo
Una mirada al increíble mundo de los datos desde la perspectiva de Python
¡Te damos la bienvenida a nuestra segunda clase de la Inmersión Datos con Python!
En esta aula avanzaremos con nuestro proyecto y comenzaremos a experimentar con algunos algoritmos de machine learning como Regresión Logística, Árboles de Decisión, Random Forest, Naive Bayes, entre otros. Luego de crearlos, evaluaremos los modelos utilizando métricas como precisión, recall, área bajo la curva ROC, y F1-score para finalmente, seleccionar el modelo con el mejor rendimiento para la predicción de la solvencia crediticia.
La clase está llena de contenido y debates interesantes, ¡así que disfruta con nosotros!
Para ver los ejercicios y todo el contenido que se abordó en clases, sigue los pasos que te mostraremos a continuación:
Base de datos y materiales de aula
- Descarga la base de datos en CSV.
- Descarga el diccionario con la explicación de cada uno de los campos de la base de datos.
Links citados
- Accede al notebook del aula 02.
- Haz clic en el botón de
.
- En el menú superior izquierdo, haz clic en >Archivo, y después en la opción >Guardar una copia en Drive.
- Si aún no has accedido con tu cuenta de Gmail, un pop-up solicitará que crees o hagas el login con una cuenta de Google.
- Tras hacer el login, se creará una copia del aula en tu Drive (directorio Colab Notebook, creado automáticamente).
- Abre el notebook, y ¡Diviértete!
Desafíos de esta aula
- Evaluar la Matriz de Confusión.
- Balancear la variable target.
- Seleccionar sólo algunas variables y reevaluar los modelos.
Algunos recordatorios y tips
- Si tienes dificultades para usar Colab, accede a este artículo de Alura.
- Explora diferentes modelos con scikit-learn.
- ¿Quieres conocer más sobre métricas de evaluación? Te recomendamos este material.
- Una guía rápida para Pandas.
Publica tu proyecto
¡Muestra tu proyecto al mundo compartiéndolo en LinkedIn e Instagram! Etiqueta Alura Latam (@aluralatam) y los instructores Álvaro (ahcamachod), Alejandro Gamarra (elprofealejo.info) y a Christian Velasco (christian_pva).
¡Nos encantaría ver tus proyectos y seguir tu evolución! Recuerda usar la hashtag #InmersionDatosAlura para que tu proyecto tenga más alcance.
Ah, y no olvides poner la tag #InmersionDatosAlura dentro de tu proyecto en GitHub. Simplemente haz clic en el engranaje que aparece en la sección About y coloca la etiqueta #InmersionDatosAlura dentro del campo Topics.
¡Queremos ver tu portafolio!
Discord
¡Únete a Discord para obtener respuestas a tus preguntas y conocer a otras personas que se sumergen en Ciencia de Datos contigo! Haz clic aquí para entrar.
¡Buenos estudios y hasta nuestra próxima clase!