Python
ciencia-de-datos
seaborn
visualización de datos
La visualización de datos es fundamental en el análisis de datos y la ciencia de datos. Seaborn es una biblioteca de Python que simplifica la creación de gráficos estadísticos con una apariencia más estética y menos código que Matplotlib. En este artículo, exploraremos los conceptos básicos de Seaborn y cómo aprovecharlo para visualizar datos de manera efectiva.
Seaborn es una biblioteca basada en Matplotlib que facilita la creación de gráficos estadísticos. Proporciona una interfaz de alto nivel para generar visualizaciones atractivas y bien estructuradas con menos código.
Para comenzar, necesitas instalar la librería. Puedes hacerlo con el siguiente comando:
1pip install seaborn
Seaborn
incluye algunos conjuntos de datos predefinidos que podemos usar para practicar. Veamos cómo cargar uno:
1import seaborn as sns 2import pandas as pd 3 4# Cargar dataset de ejemplo 5iris = sns.load_dataset("iris") 6print(iris.head())
Un gráfico de dispersión es útil para visualizar la relación entre dos variables.
1sns.scatterplot(x="sepal_length", y="sepal_width", data=iris) 2plt.title("Gráfico de Dispersión de Iris") 3plt.show()
Los gráficos de barras permiten comparar categorías.
1sns.barplot(x="species", y="sepal_length", data=iris) 2plt.title("Promedio de Largo del Sépalos por Especie") 3plt.show()
Un histograma nos ayuda a visualizar la distribución de una variable.
1sns.histplot(iris["sepal_length"], bins=20, kde=True) 2plt.title("Distribución del Largo del Sépalo") 3plt.show()
Los boxplots ayudan a visualizar la distribución y los valores atípicos.
1sns.boxplot(x="species", y="petal_length", data=iris) 2plt.title("Distribución del Largo de los Pétalos por Especie") 3plt.show()
Un heatmap nos permite visualizar la relación entre variables numéricas.
1import numpy as np 2 3corr = iris.corr() 4sns.heatmap(corr, annot=True, cmap="coolwarm", linewidths=0.5) 5plt.title("Mapa de Calor de Correlación") 6plt.show()
Este gráfico muestra múltiples gráficos de dispersión en una misma figura.
1sns.pairplot(iris, hue="species") 2plt.show()