Clase 02 - Construcción, Evaluación y selección del mejor modelo

Participa y entra más a fondo

Una mirada al increíble mundo de los datos desde la perspectiva de Python

¡Te damos la bienvenida a nuestra segunda clase de la Inmersión Datos con Python!

En esta aula avanzaremos con nuestro proyecto y comenzaremos a experimentar con algunos algoritmos de machine learning como Regresión Logística, Árboles de Decisión, Random Forest, Naive Bayes, entre otros. Luego de crearlos, evaluaremos los modelos utilizando métricas como precisión, recall, área bajo la curva ROC, y F1-score para finalmente, seleccionar el modelo con el mejor rendimiento para la predicción de la solvencia crediticia.

La clase está llena de contenido y debates interesantes, ¡así que disfruta con nosotros!

Para ver los ejercicios y todo el contenido que se abordó en clases, sigue los pasos que te mostraremos a continuación:

Base de datos y materiales de aula

  • Accede al notebook del aula 02.
  • Haz clic en el botón de colab.png.
  • En el menú superior izquierdo, haz clic en >Archivo, y después en la opción >Guardar una copia en Drive.
  • Si aún no has accedido con tu cuenta de Gmail, un pop-up solicitará que crees o hagas el login con una cuenta de Google.
  • Tras hacer el login, se creará una copia del aula en tu Drive (directorio Colab Notebook, creado automáticamente).
  • Abre el notebook, y ¡Diviértete!

Desafíos de esta aula

  • Evaluar la Matriz de Confusión.
  • Balancear la variable target.
  • Seleccionar sólo algunas variables y reevaluar los modelos.

Algunos recordatorios y tips

Publica tu proyecto

¡Muestra tu proyecto al mundo compartiéndolo en LinkedIn e Instagram! Etiqueta Alura Latam (@aluralatam) y los instructores Álvaro (ahcamachod), Alejandro Gamarra (elprofealejo.info) y a Christian Velasco (christian_pva).

¡Nos encantaría ver tus proyectos y seguir tu evolución! Recuerda usar la hashtag #InmersionDatosAlura para que tu proyecto tenga más alcance.

Ah, y no olvides poner la tag #InmersionDatosAlura dentro de tu proyecto en GitHub. Simplemente haz clic en el engranaje que aparece en la sección About y coloca la etiqueta #InmersionDatosAlura dentro del campo Topics.

¡Queremos ver tu portafolio!

Discord

¡Únete a Discord para obtener respuestas a tus preguntas y conocer a otras personas que se sumergen en Ciencia de Datos contigo! Haz clic aquí para entrar.

¡Buenos estudios y hasta nuestra próxima clase!

¿Quiénes son los buceadores?

Instructores de Alura en esta inmersión

  • Álvaro Camacho

    Álvaro Camacho

    Instructor de Ciencia de Datos en Alura Latam. Ingeniero de Telecomunicaciones de la UNAD con MBA en Telecomunicaciones, Sistemas Informáticos e IoT y posgrado en Data Analytics.

  • Christian Velasco

    Christian Velasco

    Head de Alura Latam. Ingeniero Industrial de la UPSA con Especialidad en Big Data Analytics.

  • Alejandro Gamarra

    Alejandro Gamarra

    Especialista en BI/Big Data, con más de 20 años de experiencia trabajando en las unidades de Data Science de Telefónica, con proyectos de Big Data a nivel mundial.