A tu propio ritmo

Explora nuestra extensa colección de cursos diseñados para ayudarte a dominar varios temas y habilidades. Ya seas un principiante o un aprendiz avanzado, aquí hay algo para todos.

Bootcamp

Aprende en vivo

Únete a nosotros en nuestros talleres gratuitos, webinars y otros eventos para aprender más sobre nuestros programas y comenzar tu camino para convertirte en desarrollador.

Próximos eventos en vivo

Catálogo de contenidos

Para los geeks autodidactas, este es nuestro extenso catálogo de contenido con todos los materiales y tutoriales que hemos desarrollado hasta el día de hoy.

Tiene sentido comenzar a aprender leyendo y viendo videos sobre los fundamentos y cómo funcionan las cosas.

Buscar en lecciones


IngresarEmpezar
← Volver a Cómo hacerlo

¿Cómo crear un DataFrame?

Escrito por:

DataFrame en Pandas
Formas de crear un DataFrame

Un DataFrame es una estructura de dos dimensiones, muy similar a una hoja de cálculo o una tabla en base de datos, veamos como crear un DataFrame a partir de una lista.

Loading...

En este ejemplo, utilizamos la función DataFrame() para crear un DataFrame a partir de las lista list_rrss y su resultado se guarda en la variable df_rrss, a la función DataFrame() en este caso le pasamos dos argumentos, la variable list_rrss la cual serán los datos del DataFrame y columns donde se especifica el nombre de las columnas, en este caso Name. Finalmente, se muestra por la terminal el DataFrame con los nombres de las redes sociales en la columna Name.

🔗 Si quieres un tutorial sobre Pandas python, te invito a leer el Blog de 4Geeks, donde encontrarás mucha información relevante.

DataFrame en Pandas

Un DataFrame como se mencionó anteriormente es una estructura de dos dimensiones, para crear un DataFrame en Pandas, primero se necesita importar la librería Pandas y luego utilizar la clase pandas.DataFrame. La clase pandas.DataFrame permite varios parámetros a la hora de crearse, veamos cuales son estos parámetros:

1pandas.DataFrame(data, index, columns, dtype)
  • data: Representa los datos que utilizara el DataFrame, puede ser un objeto, una lista, un diccionario, otro DataFrame, entre otros.
  • index: Se utiliza cuando queremos especificar los índices del DataFrame, si no se le proporciona este parámetro por defecto genera índices numéricos.
  • columns: Se utiliza cuando queremos especificar los nombres de las columnas del DataFrame, si no se le proporciona este parámentro por defecto genera índices numéricos.
  • dtype: Se utiliza para especificar el tipo de datos de las columnas DataFrame, por ejemplo, int, float, object, etc. Si no se le proporciona este parámetro, por defecto infiere el tipo de dato a partir de los datos suministrados.

Veamos un ejemplo donde hace uso de los parámetros antes mencionados:

Loading...

En este ejemplo se crea un DataFrame utilizando el diccionario data_countries, adicionalmente se especifican los índices y nombres de las columnas con las listas indexes y columns respectivamente.

Formas de crear un DataFrame

Existen distintas maneras de crear un DataFrame en Python, a continuación explicaremos algunas de ellas.

Creación de un dataframe vacio

Loading...

Creación de un dataframe a partir de una lista de listas

Loading...

Creación de un DataFrame desde un diccionario de listas

Loading...

Creación de un dataframe a partir de una lista de diccionarios

Loading...

Métodos más importantes del dataframe

La clase pandas.DataFrame ofrece una amplia gama de métodos que pueden ser útiles a la hora de analizar datos, a continuación explicaremos los más importantes:

  • head(n): Este método retorna las primeras n filas del DataFrame.
Loading...
  • tail(n): Este método retorna las últimas n filas del DataFrame.
Loading...
  • info():Este método muestra información detallada sobre el DataFrame, por ejemplo, el número de filas y columnas, el tipo de datos de cada columna, entre otros datos.
Loading...
  • describe(): Genera estadísticas descriptivas del DataFrame, como el recuento, la media, la desviación estándar, etc.
Loading...
  • loc[row_indexer, col_indexer]: Accede a un subconjunto de filas y columnas basándose en las etiquetas del índice.
Loading...
  • iloc[row_indexer, col_indexer]: Accede a un subconjunto de filas y columnas basándose en la posición de índice.
Loading...
  • sort_values(by): Este método permite ordenar el DataFrame por los valores de una columna o una lista de columnas.
Loading...

Podemos concluir que los DataFrames son una herramienta muy poderosa para trabajar con datos tabulares, ya que nos permite analizar y manipular gran cantidad de datos que en ocasiones son muy complejos, por lo que son ampliamente utilizados en áreas de desarrollo como son Machine learning, Data Science, Data Analysis, entre otras.

🔗 Si te interesa conocer más a fondo cómo puedes utilizar la biblioteca de Pandas en Machine Learning te recomiendo que visites el artículo sobre pandas para machine learning, donde encontraras recursos muy utiles y explicaciones con ejemplos de código y videotutoriales que te ayudarán a enterder mejor esta librería y aprenderas a utilizar todas las caracteristicas mas importantes que ofrese.