A tu propio ritmo

Explora nuestra extensa colección de cursos diseñados para ayudarte a dominar varios temas y habilidades. Ya seas un principiante o un aprendiz avanzado, aquí hay algo para todos.

Bootcamp

Aprende en vivo

Únete a nosotros en nuestros talleres gratuitos, webinars y otros eventos para aprender más sobre nuestros programas y comenzar tu camino para convertirte en desarrollador.

Próximos eventos en vivo

Catálogo de contenidos

Para los geeks autodidactas, este es nuestro extenso catálogo de contenido con todos los materiales y tutoriales que hemos desarrollado hasta el día de hoy.

Tiene sentido comenzar a aprender leyendo y viendo videos sobre los fundamentos y cómo funcionan las cosas.

Full-Stack Software Developer - 16w

Data Science and Machine Learning - 16 wks

Buscar en lecciones


IngresarEmpezar
← Regresar a lecciones

Weekly Coding Challenge

Todas las semanas escogemos un proyecto de la vida real para que construyas tu portafolio y te prepares para conseguir un trabajo. Todos nuestros proyectos están construidos con ChatGPT como co-pilot!

Únete al reto

Podcast: Code Sets You Free

Un podcast de cultura tecnológica donde aprenderás a luchar contra los enemigos que te bloquean en tu camino para convertirte en un profesional exitoso en tecnología.

Escuchar el podcast
Editar en Github

¿Qué es Pandas en Python?

¿Qué es Pandas en Python?
Sintaxis: Ejemplos de código de las acciones más básicas

Pandas es una popular librería de manipulación de datos que incluye optimas herramientas de estructura de datos y análisis de información. Su uso se ha extendido a muchos campos como ciencia de datos, finanzas o inteligencia artificial. Durante este artículo, se explicará su uso, la sintaxis para poder aplicar diferentes tareas y algunos casos prácticos. Si quieres un tutorial sobre Pandas, te invito a leer el Blog de 4Geeks, donde encontrarás mucha información relevante.

Aquí un ejemplo inicial sobre Pandas en Python:

1import pandas as pd 2 3# Cargamos informacion de un archivo CSV 4data = pd.read_csv(‘data.csv’) 5# Imprimimos las primeras 5 filas del nuevo DataFrame 6print(data.head()) 7 8# Resultado 9 Nombre Edad País 100 Alejandro 28 Colombia 111 Ana 34 Mexico 122 Pedro 29 Costa Rica

¿Qué es Pandas en Python?

Pandas es una librería open-source que se puede usar con Python y ofrece una gran variedad de optimas y eficientes herramientas para manipular datos de acuerdo con los objetivos establecidos. Además, es posible trabajar tanto con números como con texto, limpieza de datos y explorar los datos para hallar patrones.

Es importante entender que pandas se compone de dos estructuras: Series y DataFrame. Series puede ser entendido como una lista que puede contener cualquier tipo de dato, mientras que el DataFrame es una estructura compuesta de columnas y filas, lo que posibilita aplicar distintas operaciones.

¿Cómo se usa Pandas en Python?

Entre las funcionalidades principales de Pandas destacan:

  1. Cargar datos: Pandas permite cargar datos fácilmente de diferentes fuentes como Excel, Sql, CSV, etc.
  2. Limpieza y procesamiento de datos: Pandas contiene métodos para manejar datos faltantes, duplicados, valores atípicos o transformación de los mismos si es necesario.
  3. Filtrar y Seleccionar datos: Es posible filtrar, seleccionar o recorrer valores de acuerdo con condiciones, filtros, nombres de columnas o filas, etc.
  4. Manipulación de datos: Pandas proporciona un amplio conjunto de métodos para agrupar, unir, agregar y remodelar datos que abre las oportunidades para manejar cualquier información.
  5. Visualización de datos: Pandas puede trabajar óptimamente con otras librerías basadas en la visualización de datos tal como Matplotlib o Seaborn para crear visualizaciones enriquecedoras.

Sintaxis: Ejemplos de código de las acciones más básicas

Ahora se mostrará ejemplos para tener una mayor claridad de cómo funciona la sintaxis básica de Pandas en Python:

Crear un DataFrame

1import pandas as pd 2data = {'name': ['Juan', 'Ana', 'Pedro'], 3 'age': [28, 34, 29], 4 'country': ['Colombia', 'México', 'Costa Rica']} 5# Se utiliza data para create un DataFrame(df) 6df = pd.DataFrame(data) 7print(df) 8 9# Resultado 10 name age country 110 Alejandro 28 Colombia 121 Ana 34 México 132 Pedro 29 Costa Rica

Filtrar y Seleccionar valores

1import pandas as pd 2 3# Filtrar los valores de acuerdo con una condicion 4valores_filtrados = df[df['age'] > 30] 5 6# Seleccionar columnas especificas 7columna_seleccionada = df[['name', 'country']] 8 9# Imprimir los datos filtrados: 10print(valores_filtrados) 11print(columna_seleccionada) 12 13# Resultado 14 name age country 151 Ana 34 México 16 17 name country 180 Alejandro Colombia 191 Ana México 202 Pedro Costa Rica

Agregación de datos

1import pandas as pd 2 3# Agrupar datos por país y calcular el promedio 4datos_agrupados = df.groupby('country')['age'].mean() 5 6# Imprimir datos_agrupados 7print(datos_agrupados) 8 9# Resultado 10country 11México 34.0 12Colombia 28.0 13Costa Rica 29.0 14Name: age, dtype: float64

Casos de uso

Ahora se mostrará algunos casos de uso en donde se puede utilizar Pandas eficientemente con datos.

Procesamiento y Limpieza de datos

Para procesar y limpiar datos, se puede integrar un código similar a este:

1import pandas as pd 2 3# Manear datos faltantes 4df.dropna() # Remueve las filas o columnas vacías 5df.fillna() # Rellena valores vacíos con un valor especifico 6 7# Remover los duplicados 8df.drop_duplicates() # Remueve las filas duplicadas

Análisis exploratorio de datos

Con Pandas, se puede obtener perspectivas de nuestra información como relaciones, patrones, estadísticas, etc.

1import pandas as pd 2 3# Obtenemos las estadísticas de nuestro conjunto de datos 4df.describe() 5 6# Agrupa y sumar valores específicos 7df.groupby('category')['sales'].sum() # Con esto obtenemos el total de ventas por cada cateogria

Transformación y Manipulación de Datos

Mediante Pandas se puede manipular y transformar datos de la siguiente manera:

1Import pandas as pd 2 3# Unir conjuntos de datos 4df_unido = pd.merge(df1, df2, on='ID') # Con esta linea se unen dos DataFrames por medio del ID como columna comun 5 6# Remodelación de datos 7df.pivot_table(index='sale_date', columns='products', values='sales') # Se crea una tabla pivote con estos datos

Conclusión

Pandas es una herramienta muy poderosa que provee varias opciones para desarrollar el análisis de datos. Esta librería se ha vuelto muy popular en los campos de la ciecia de datos, analistas y la inteligencia artificial. Mediante Python y Pandas, se pueden alcanzar varios objeticos al momento de analizar cualquier conjunto de datos y tomar decisiones.

Para aprender mas sobre Pandas y practicar estas habilidades, 4geeks ofrece este tutorial interactivo de Python y Pandas.