A tu propio ritmo

Explora nuestra extensa colección de cursos diseñados para ayudarte a dominar varios temas y habilidades. Ya seas un principiante o un aprendiz avanzado, aquí hay algo para todos.

Bootcamp

Aprende en vivo

Únete a nosotros en nuestros talleres gratuitos, webinars y otros eventos para aprender más sobre nuestros programas y comenzar tu camino para convertirte en desarrollador.

Próximos eventos en vivo

Catálogo de contenidos

Para los geeks autodidactas, este es nuestro extenso catálogo de contenido con todos los materiales y tutoriales que hemos desarrollado hasta el día de hoy.

Tiene sentido comenzar a aprender leyendo y viendo videos sobre los fundamentos y cómo funcionan las cosas.

Buscar en lecciones


Empezar tutorial interactivo

← Volver a Proyectos

Tutorial del Proyecto K-vecinos más Cercanos

Dificultad

  • easy

Duración promedio

2 hrs

Tecnologías

Dificultad

  • easy

Duración promedio

2 hrs

📝 Instrucciones
  • Comprender un dataset nuevo.
  • Modelar los datos utilizando un KNN.
  • Analizar los resultados y optimizar el modelo.

🌱 Cómo iniciar este proyecto

Sigue las siguientes instrucciones:

  1. Crea un nuevo repositorio basado en el proyecto de Machine Learning haciendo clic aquí.
  2. Abre el repositorio creado recientemente en Codespace usando la extensión del botón de Codespace.
  3. Una vez que el VSCode del Codespace haya terminado de abrirse, comienza tu proyecto siguiendo las instrucciones a continuación.

📝 Instrucciones

Clasificador de Vinos con KNN

Entrena un modelo de K-Vecinos más Cercanos (KNN) para predecir la calidad de un vino tinto a partir de sus características químicas. ¿Podría una IA ayudarte a elegir un vino digno de sommelier?

Utilizaremos el siguiente dataset de vinos tintos extraido de Wine Quality Data Set - UCI

1https://raw.githubusercontent.com/4GeeksAcademy/k-nearest-neighbors-project-tutorial/refs/heads/main/winequality-red.csv

Descripción de las columnas

Cada fila representa un vino. Las columnas describen su composición química:

  • fixed acidity, volatile acidity, citric acid

  • residual sugar, chlorides

  • free sulfur dioxide, total sulfur dioxide

  • density, pH, sulphates, alcohol

La columna objetivo es label:

  • 0 = Baja calidad

  • 1 = Calidad media

  • 2 = Alta calidad

¡Empecemos! 😎

  1. Carga los datos. Carga el CSV con Pandas y explora su estructura.

  2. Entrena el modelo KNN:

    • Separa las variables independientes (X) del objetivo (y).

    • Divide en conjunto de entrenamiento y prueba (80/20).

    • Escala los datos si es necesario (¡muy recomendable con KNN!).

    • Entrena el modelo con un valor de k inicial.

  3. Evalúa el rendimiento usando:

    • accuracy_score

    • confusion_matrix

    • classification_report

  4. Optimización de k. Crea un bucle para probar diferentes valores de k (por ejemplo, de 1 a 20).

    • Guarda los resultados en una lista.

    • Grafica accuracy vs k para encontrar el mejor valor.

¿Te sientes confiado/a?

Crea una función que reciba valores numéricos y prediga la calidad

1predict_wine_quality([7.4, 0.7, 0.0, 1.9, 0.076, 11.0, 34.0, 0.9978, 3.51, 0.56, 9.4]) 2>>> "Este vino probablemente sea de calidad media 🍷"

Nota: También incorporamos muestras de solución en ./solution.ipynb que te sugerimos honestamente que solo uses si estás atascado por más de 30 minutos o si ya has terminado y quieres compararlo con tu enfoque.

🚀 Haz visible tu trabajo

Trabajaste con un dataset real del UCI Machine Learning Repository, aplicaste modelos de clasificación supervisada, analizaste características químicas y desarrollaste una función que simula el juicio de un sommelier usando IA. ¡Eso merece ser contado!

¿Qué compartir?

Comparte una frase de insight que muestre cómo la IA puede clasificar la calidad del vino con base en su composición. Añade una gráfica de precisión vs. k (muy visual) o una predicción divertida con predict_wine_quality().


✨ Ejemplo posteable

"¿Puede la inteligencia artificial predecir la calidad de un vino? 🍷 Entrené un modelo KNN con datos reales del UCI ML Repo y alcancé una precisión del 73% al clasificar vinos en baja, media y alta calidad usando solo su composición química. Los datos no mienten: ¡el alcohol y el sulfato son más reveladores que una etiqueta! 😉 #MachineLearning #DataScience #WineLovers #IA #scikitLearn"

🚛 Cómo entregar este proyecto

Una vez que hayas terminado de resolver el caso práctico, asegúrate de confirmar tus cambios, haz push a tu repositorio y ve a 4Geeks.com para subir el enlace del repositorio.

Regístrate para obtener acceso gratis a archivos y video de la solución

Lo usaremos para darte acceso a la comunidad.
¿Ya tienes una cuenta? Inicia sesión aquí.

Al registrarte estás aceptando nuestros Términos y condiciones y Política de privacidad.

Dificultad

  • easy

Duración promedio

2 hrs

Dificultad

  • easy

Duración promedio

2 hrs

Dificultad

  • easy

Duración promedio

2 hrs

Dificultad

  • easy

Duración promedio

2 hrs

Regístrate para obtener acceso gratis a archivos y video de la solución

Lo usaremos para darte acceso a la comunidad.
¿Ya tienes una cuenta? Inicia sesión aquí.

Al registrarte estás aceptando nuestros Términos y condiciones y Política de privacidad.

Dificultad

  • easy

Duración promedio

2 hrs

Dificultad

  • easy

Duración promedio

2 hrs