Cómo trabajar con datos vacíos o nulos en pandas
Hay varias maneras de trabajar con datos vacíos en pandas. Una forma es simplemente eliminar las filas o columnas que contengan datos faltantes, vacíos o nulos (NaN). Esto puede hacerse utilizando el método 'dropna()' y, mediante su empleo conseguiremos unificar los datos para evitar posibles errores en la salida de los datos.
Al usar el método 'inplace' modificamos el DataFrame original en lugar de realizar una copia, reduciendo el consumo de recursos al rellenar los valores vacíos o nulos. Hay que tener en cuenta que los datos son modificados en el conjunto de datos original, así que a partir de ese momento permanecerán inalterables salvo que realicemos otra operación con el DataFrame.
- Índice de contenidos:
Script Python para eliminar datos nulos y vacíos con pandas
import pandas as pd
# Supongamos que tenemos una lista de listas que representa un DataFrame con datos nulos
data = [[1, 2, None], [3, None, 5], [None, 4, 6]]
# Podemos convertir esa lista de listas en un DataFrame de pandas
df = pd.DataFrame(data)
# Añadimos los nombres de las columnas
df = pd.DataFrame(data, columns=["columna 1", "columna 2", "columna 3"])
# Mostramos el resultado
print('\n--------------------')
print('El DataFrame contiene:')
print(df)
--------------------
El DataFrame contiene:
columna 1 columna 2 columna 3
0 1.0 2.0 NaN
1 3.0 NaN 5.0
2 NaN 4.0 6.0
# Eliminamos las filas que contengan datos nulos o vacíos
df.dropna()
# Mostramos el resultado
print('\n--------------------')
print('El resultado con la eliminación de valores nulos es:')
print(df)
--------------------
El resultado con la eliminación de valores nulos es:
columna 1 columna 2 columna 3
0 1.0 2.0 NaN
1 3.0 NaN 5.0
2 NaN 4.0 6.0
--------------------
# También podemos rellenar los datos nulos o vacíos (empty) con un valor específico, en este caso cero.
df.fillna(0, inplace=True)
# Mostramos el resultado
print('\n--------------------')
print('El resultado con cambiando nulos por cero (0) es:')
print(df)
--------------------
El resultado con cambiando nulos por cero (0) es:
columna 1 columna 2 columna 3
0 1.0 2.0 0.0
1 3.0 0.0 5.0
2 0.0 4.0 6.0
--------------------
Comentarios del artículo "Cómo trabajar con datos vacíos o nulos en pandas"
¿Te ha gustado la información? Coméntanos tus opiniones, dudas y sugerencias: