Proyecto de Random Forest

Dificultad

easy

Duración promedio

2 hrs

Tecnologías

Data Science

Machine Learning

Dificultad

easy

Duración promedio

2 hrs

Tecnologías

Data Science

Machine Learning

🌱 Cómo iniciar este proyecto

🚛 Cómo entregar este proyecto

📝 Instrucciones

Prediciendo la diabetes

Utiliza los datos que has analizado en el proyecto anterior.
Continúa con el desarrollo para buscar un modelo que se adapte mejor.

🌱 Cómo iniciar este proyecto

Sigue las siguientes instrucciones:

Crea un nuevo repositorio basado en el proyecto de Machine Learing haciendo clic aquí.
Abre el repositorio creado recientemente en Codespace usando la extensión del botón de Codespace.
Una vez que el VSCode del Codespace haya terminado de abrirse, comienza tu proyecto siguiendo las instrucciones a continuación.

🚛 Cómo entregar este proyecto

Una vez que hayas terminado de resolver el caso práctico, asegúrate de confirmar tus cambios, haz push a tu repositorio y ve a 4Geeks.com para subir el enlace del repositorio.

📝 Instrucciones

Prediciendo la diabetes

En el proyecto anterior vimos cómo podíamos utilizar un árbol de decisión para predecir conjuntos de datos relacionados con la clasificación y la regresión. Sin embargo, ¿sabías que podemos mejorar la predicción de un árbol utilizando un random forest?

Como hemos estudiado, un random forest es una agrupación de árboles generados con porciones aleatorias de los datos y con criterios también aleatorios. Esta visión nos permitiría mejorar la efectividad del modelo cuando un árbol individual no es suficiente.

En este proyecto te centrarás en esta idea entrenando el conjunto de datos para mejorar el $accuracy$ .

Recuerda que el proyecto anterior puedes encontrarlo aquí.

Paso 1: Carga del conjunto de datos

Carga el conjunto de datos procesado del proyecto anterior (dividido en muestras de entrenamiento y pruebas y analizado con el EDA).

Paso 2: Construye un random forest

Una forma de optimizar y mejorar los resultados cuando usamos árboles de decisión es generar un random forest con árboles suficientes de tal forma que haya una variedad necesaria que enriquezca la predicción. Entrénalo y analiza sus resultados. Prueba a modificar los dos hiperparámetros que definen al árbol con distintos valores y analiza su impacto con la precisión final y grafica las conclusiones.

Paso 3: Guarda el modelo

Almacena el modelo en la carpeta correspondiente.

NOTA: Solución: https://github.com/4GeeksAcademy/random-forest-project-tutorial/blob/main/solution.ipynb

Regístrate para obtener acceso gratis a archivos y video de la solución

Dificultad

easy

Duración promedio

2 hrs

Tecnologías

Data Science

Machine Learning

Dificultad

easy

Duración promedio

2 hrs

Tecnologías

Data Science

Machine Learning

Regístrate para obtener acceso gratis a archivos y video de la solución

Empezar tutorial interactivo

Proyecto de Random Forest

🌱 Cómo iniciar este proyecto

🚛 Cómo entregar este proyecto

📝 Instrucciones

Prediciendo la diabetes

Paso 1: Carga del conjunto de datos

Paso 2: Construye un random forest

Paso 3: Guarda el modelo

Regístrate para obtener acceso gratis a archivos y video de la solución

Regístrate para obtener acceso gratis a archivos y video de la solución