Blog Sobre mí Contacto Iniciar Sesión Registro

Cómo trabajar con datos vacíos o nulos en pandas

Hay varias maneras de trabajar con datos vacíos en pandas. Una forma es simplemente eliminar las filas o columnas que contengan datos faltantes, vacíos o nulos (NaN). Esto puede hacerse utilizando el método 'dropna()' y, mediante su empleo conseguiremos unificar los datos para evitar posibles errores en la salida de los datos.
  • Índice de contenidos:

Script Python para eliminar datos nulos y vacíos con pandas

import pandas as pd

# Supongamos que tenemos una lista de listas que representa un DataFrame con datos nulos
data = [[1, 2, None], [3, None, 5], [None, 4, 6]]

# Podemos convertir esa lista de listas en un DataFrame de pandas
df = pd.DataFrame(data)

# Añadimos los nombres de las columnas
df = pd.DataFrame(data, columns=["columna 1", "columna 2", "columna 3"])

# Mostramos el resultado
print('\n--------------------')
print('El DataFrame contiene:')
print(df)

--------------------
El DataFrame contiene:
   columna 1  columna 2  columna 3
0        1.0        2.0        NaN
1        3.0        NaN        5.0
2        NaN        4.0        6.0


# Eliminamos las filas que contengan datos nulos o vacíos
df.dropna()

# Mostramos el resultado
print('\n--------------------')
print('El resultado con la eliminación de valores nulos es:')
print(df)

--------------------
El resultado con la eliminación de valores nulos es:
   columna 1  columna 2  columna 3
0        1.0        2.0        NaN
1        3.0        NaN        5.0
2        NaN        4.0        6.0
--------------------


# También podemos rellenar los datos nulos o vacíos (empty) con un valor específico, en este caso cero.
df.fillna(0, inplace=True)

# Mostramos el resultado
print('\n--------------------')
print('El resultado con cambiando nulos por cero (0) es:')
print(df)

--------------------
El resultado con cambiando nulos por cero (0) es:
   columna 1  columna 2  columna 3
0        1.0        2.0        0.0
1        3.0        0.0        5.0
2        0.0        4.0        6.0
--------------------

Al usar el método 'inplace' modificamos el DataFrame original en lugar de realizar una copia, reduciendo el consumo de recursos al rellenar los valores vacíos o nulos. Hay que tener en cuenta que los datos son modificados en el conjunto de datos original, así que a partir de ese momento permanecerán inalterables salvo que realicemos otra operación con el DataFrame.
Pandas Python Data Analysis Library

Comentarios del artículo "Cómo trabajar con datos vacíos o nulos en pandas"


¿Te ha gustado la información? Coméntanos tus opiniones, dudas y sugerencias:


Añade un comentario:

Tu dirección de correo electrónico no será publicada. | Registro requerido. | ¿Ya eres usuario? Login