Escrito por:
Un DataFrame
es una estructura de dos dimensiones, muy similar a una hoja de cálculo o una tabla en base de datos, veamos como crear un DataFrame
a partir de una lista.
Loading...
En este ejemplo, utilizamos la función DataFrame()
para crear un DataFrame
a partir de las lista list_rrss
y su resultado se guarda en la variable df_rrss
, a la función DataFrame()
en este caso le pasamos dos argumentos, la variable list_rrss
la cual serán los datos del DataFrame
y columns
donde se especifica el nombre de las columnas, en este caso Name
. Finalmente, se muestra por la terminal el DataFrame
con los nombres de las redes sociales en la columna Name
.
🔗 Si quieres un tutorial sobre Pandas python, te invito a leer el Blog de 4Geeks, donde encontrarás mucha información relevante.
Un DataFrame
como se mencionó anteriormente es una estructura de dos dimensiones, para crear un DataFrame
en Pandas, primero se necesita importar la librería Pandas y luego utilizar la clase pandas.DataFrame
. La clase pandas.DataFrame
permite varios parámetros a la hora de crearse, veamos cuales son estos parámetros:
1pandas.DataFrame(data, index, columns, dtype)
data
: Representa los datos que utilizara el DataFrame
, puede ser un objeto, una lista, un diccionario, otro DataFrame
, entre otros.index
: Se utiliza cuando queremos especificar los índices del DataFrame
, si no se le proporciona este parámetro por defecto genera índices numéricos.columns
: Se utiliza cuando queremos especificar los nombres de las columnas del DataFrame
, si no se le proporciona este parámentro por defecto genera índices numéricos.dtype
: Se utiliza para especificar el tipo de datos de las columnas DataFrame
, por ejemplo, int
, float
, object
, etc. Si no se le proporciona este parámetro, por defecto infiere el tipo de dato a partir de los datos suministrados.Veamos un ejemplo donde hace uso de los parámetros antes mencionados:
Loading...
En este ejemplo se crea un DataFrame
utilizando el diccionario data_countries
, adicionalmente se especifican los índices y nombres de las columnas con las listas indexes
y columns
respectivamente.
Existen distintas maneras de crear un DataFrame
en Python, a continuación explicaremos algunas de ellas.
Loading...
Loading...
Loading...
Loading...
La clase pandas.DataFrame
ofrece una amplia gama de métodos que pueden ser útiles a la hora de analizar datos, a continuación explicaremos los más importantes:
head(n)
: Este método retorna las primeras n
filas del DataFrame
. Loading...
tail(n)
: Este método retorna las últimas n
filas del DataFrame
. Loading...
info()
:Este método muestra información detallada sobre el DataFrame
, por ejemplo, el número de filas y columnas, el tipo de datos de cada columna, entre otros datos. Loading...
describe()
: Genera estadísticas descriptivas del DataFrame
, como el recuento, la media, la desviación estándar, etc. Loading...
loc[row_indexer, col_indexer]
: Accede a un subconjunto de filas y columnas basándose en las etiquetas del índice. Loading...
iloc[row_indexer, col_indexer]
: Accede a un subconjunto de filas y columnas basándose en la posición de índice. Loading...
sort_values(by)
: Este método permite ordenar el DataFrame por los valores de una columna o una lista de columnas. Loading...
Podemos concluir que los DataFrames
son una herramienta muy poderosa para trabajar con datos tabulares, ya que nos permite analizar y manipular gran cantidad de datos que en ocasiones son muy complejos, por lo que son ampliamente utilizados en áreas de desarrollo como son Machine learning, Data Science, Data Analysis, entre otras.
🔗 Si te interesa conocer más a fondo cómo puedes utilizar la biblioteca de Pandas en Machine Learning te recomiendo que visites el artículo sobre pandas para machine learning, donde encontraras recursos muy utiles y explicaciones con ejemplos de código y videotutoriales que te ayudarán a enterder mejor esta librería y aprenderas a utilizar todas las caracteristicas mas importantes que ofrese.