4Geeks logo
4Geeks logo

Courses

Explora nuestra extensa colección de cursos diseñados para ayudarte a dominar varios temas y habilidades. Ya seas un principiante o un aprendiz avanzado, aquí hay algo para todos.

Coding Bootcamp

Aprende en vivo

Únete a nosotros en nuestros talleres gratuitos, webinars y otros eventos para aprender más sobre nuestros programas y comenzar tu camino para convertirte en desarrollador.

Próximos eventos en vivo

Catálogo de contenidos

Para los geeks autodidactas, este es nuestro extenso catálogo de contenido con todos los materiales y tutoriales que hemos desarrollado hasta el día de hoy.

Tiene sentido comenzar a aprender leyendo y viendo videos sobre los fundamentos y cómo funcionan las cosas.

Full-Stack Software Developer - 16w

Data Science and Machine Learning - 16 wks

Buscar en lecciones


IngresarEmpezar
← Regresar a lecciones

Weekly Coding Challenge

Todas las semanas escogemos un proyecto de la vida real para que construyas tu portafolio y te prepares para conseguir un trabajo. Todos nuestros proyectos están construidos con ChatGPT como co-pilot!

Únete al reto

Podcast: Code Sets You Free

Un podcast de cultura tecnológica donde aprenderás a luchar contra los enemigos que te bloquean en tu camino para convertirte en un profesional exitoso en tecnología.

Escuchar el podcast
Editar en Github
Abrir en Colab

Introduccion a Matplotlib

alt text

Introducción a Matplotlib

Matplotlib es una librería de visualización de Python que proporciona una variedad de herramientas y funciones para crear gráficos y visualizaciones estáticas, animadas e interactivas. Es una de las bibliotecas más populares y ampliamente utilizadas en la comunidad de Python.

pyplot es un módulo de la biblioteca Matplotlib que proporciona una interfaz sencilla e intuitiva para crear gráficos. Normalmente es el módulo que utilizan los ingenieros de Machine Learning y ciencia de datos para sus representaciones gráficas. En concreto, los puntos claves de este módulo son:

  • Interfaz de alto nivel: pyplot ofrece una serie de funcionalidades que facilitan la creación rápida de gráficos.
  • Funcionalidad: Ofrece una amplia variedad de funciones para gráficos de barras, de puntos, de caja, etcétera.
  • Integración: Está integrado estrechamente con entornos como Jupyter Notebook, lo que permite visualizar gráficos directamente dentro de los notebooks.
In [1]:
import numpy as np

X = np.linspace(0, 10, 100)
y = np.sin(X)
z = np.cos(X)

Gráfico de líneas

El gráfico de líneas (line plot) representa la información en puntos conectados por líneas. Es útil para mostrar la evolución de una o más series de datos a lo largo de un eje, típicamente el tiempo,

In [2]:
import matplotlib.pyplot as plt

plt.figure(figsize = (10, 5))

plt.plot(X, y, label = "Seno de X")
plt.plot(X, z, label = "Coseno de X")

plt.title("Gráfico de líneas")
plt.legend()
plt.show()
No description has been provided for this image

Gráfico de dispersión

El gráfico de dispersión (scatter plot) muestra valores individuales de dos variables numéricas en un plano cartesiano (con dos ejes). Cada punto representa una observación.

In [3]:
plt.figure(figsize = (10, 5))

plt.scatter(X, y, label = "Seno de X")

plt.title("Gráfico de dispersión")
plt.legend()
plt.show()
No description has been provided for this image

Histograma

El histograma (histogram) representa la distribución de una variable numérica dividiendo el rango de datos en intervalos y mostrando cuántos datos caen en cada uno de ellos (para variables continuas) o la frecuencia de cada categoría (para variables categóricas).

In [4]:
data = np.random.randn(1000)

plt.figure(figsize = (10, 5))

plt.hist(data, bins = 30, alpha = 0.7)

plt.title("Histograma")
plt.show()
No description has been provided for this image

Gráfico de barras

El gráfico de barras (bar plot) representa datos categóricos con barras rectangulares con alturas (o longitudes, en el caso de barras horizontales) proporcionales a los valores que representan.

In [5]:
labels = ["A", "B", "C", "D"]
values = [10, 20, 15, 30]

plt.figure(figsize = (10, 5))

plt.bar(labels, values)

plt.title("Gráfico de barras")
plt.show()
No description has been provided for this image

Gráfico circular

Un gráfico circular (pie chart) representa datos en sectores circulares, donde cada sector corresponde a una categoría y su tamaño es proporcional al valor que representa.

In [6]:
labels = ["A", "B", "C", "D"]
sizes = [215, 130, 245, 210]

plt.figure(figsize = (7, 7))

plt.pie(sizes, labels = labels)

plt.title("Gráfico circular")
plt.show()
No description has been provided for this image

Gráfico de caja

Un gráfico de caja (boxplot) muestra la distribución de datos cuantitativos mediante su cuartil y posiblemente valores atípicos.

alt text

Los extremos de la caja indican el cuartil inferior y superior, mientras que la línea dentro de la caja indica la mediana.

In [7]:
data = np.random.randn(1000)

plt.figure(figsize = (10, 5))

plt.boxplot(data)

plt.title("Gráfico de caja")
plt.show()
No description has been provided for this image

Ejercicio 01: Crea un gráfico de dispersión a partir de los siguientes vectores: x = [1, 2, 3, 4], y = [1, 2, 0, 0.5] (★☆☆)

In [ ]:

Ejercicio 02: Crea un gráfico de líneas a partir de los dos vectores del ejercicio anterior (★☆☆)

In [ ]:

Ejercicio 03: Crea un histograma a partir de un array aleatorio que siga una distribución normal N (2,1.5)N ~ (2, 1.5) (★★☆)

In [ ]:

Ejercicio 04: Crea un DataFrame a partir del dataset de Titanic y muestra las distribuciones de la edad y del importe de los billetes (★★★)

NOTA: Puedes encontrar el dataset en https://raw.githubusercontent.com/cvazquezlos/machine-learning-prework/main/04-matplotlib/assets/titanic_train.csv

In [ ]: