Blog Sobre mí Contacto Iniciar Sesión Registro

Introducción a Pandas para principiantes

Pandas es una biblioteca de código abierto para el análisis de datos en Python. Proporciona herramientas eficientes para manipular y analizar conjuntos de datos con formato tabular. También para tratar datos en archivos csv separados por comas u otros delimitadores, conjuntos de datos de Excel y prácticamente cualquier tipo de archivo. Esta biblioteca es muy útil para científicos de datos, analistas de negocios, desarrolladores de software y SEOS que necesitan trabajar con datos en forma de tablas.

La principal estructura de datos en Pandas es el DataFrame, que podemos imaginarlo como una tabla de datos en la que cada columna tiene un nombre y un tipo de datos específico y cada fila tiene un índice que permite identificarla de manera única. Los DataFrames se pueden crear a partir de diferentes fuentes de datos como archivos CSV, Excel, bases de datos SQL o incluso directamente desde una lista o diccionario en Python.

Una vez que se tiene un DataFrame, se pueden aplicar diferentes operaciones sobre él, como por ejemplo seleccionar y filtrar filas o columnas, agrupar y resumir datos, hacer cálculos y gráficos y mucho más. Pandas ofrece una amplia gama de funcionalidades que facilitan el análisis y manipulación de datos en Python.

Para empezar a trabajar con Pandas, primero es necesario instalarlo en el sistema. Esto se puede hacer utilizando el administrador de paquetes pip. Solo necesitamos escribir desde consola con nuestro entorno virtual activado lo siguiente:  

pip install pandas
Una vez instalado, se puede importar Pandas en nuestro código con una única línea para poder usar todas sus funciones en un script Python con el siguiente comando.
import pandas as pd
Con esto ya tenemos acceso a todas las funcionalidades de Pandas y podemos empezar a trabajar con DataFrames. Por ejemplo, para crear un DataFrame a partir de una lista de diccionarios haríamos lo siguiente:
import pandas as pd

data = [
    {'nombre': 'Juan', 'edad': 25, 'genero': 'M'},
    {'nombre': 'Ana', 'edad': 32, 'genero': 'F'},
    {'nombre': 'Mario', 'edad': 19, 'genero': 'M'},
    {'nombre': 'Sofía', 'edad': 28, 'genero': 'F'},
]

df = pd.DataFrame(data)
Con este código se crea un DataFrame llamado df que contiene cuatro filas y tres columnas con los datos especificados en la lista de datos. Se puede acceder a las filas y columnas del DataFrame de diferentes maneras. Por ejemplo, para seleccionar una columna específica podemos utilizar el nombre de la columna como un atributo del DataFrame:
# Seleccionar la columna 'nombre' del DataFrame
df['nombre']
También se pueden seleccionar múltiples columnas utilizando una lista de nombres de columnas:
# Seleccionar las columnas 'nombre' y 'edad' del DataFrame
df[['nombre', 'edad']]
Para seleccionar filas específicas del DataFrame se pueden utilizar diferentes métodos, como por ejemplo el método 'loc' que permite seleccionar filas por su índice:
# Seleccionar la primera fila del DataFrame
df.loc[0]

# Seleccionar la primera y la tercera fila del DataFrame
df.loc[[0, 2]]
También podemos seleccionar filas utilizando una condición booleana, obteniendo todas las filas en las que la columna  'genero' tenga el valor 'F' de femenino:
# Seleccionar las filas en las que la columna 'genero' es 'F'
df[df['genero'] == 'F']
Además de seleccionar filas y columnas, Pandas también permite agrupar y resumir datos de un DataFrame utilizando el método 'groupby'. Por ejemplo, para agrupar las filas del DataFrame por la columna 'genero' y calcular la edad media para cada grupo haríamos lo siguiente:
# Agrupar las filas por la columna 'genero' y calcular la edad media para cada grupo
df.groupy('genero')['edad'].mean()
Estos son solo algunos ejemplos de lo que se puede hacer con Pandas. Esta biblioteca ofrece una amplia gama de funcionalidades que facilitan el análisis y manipulación de datos en Python. Si deseas aprender más sobre Pandas, puedes ver más funciones que hemos publicado.
Pandas Python Data Analysis Library

Comentarios del artículo "Introducción a Pandas para principiantes"


¿Te ha gustado la información? Coméntanos tus opiniones, dudas y sugerencias:


Añade un comentario:

Tu dirección de correo electrónico no será publicada. | Registro requerido. | ¿Ya eres usuario? Login