Usando Python 2.7 y Pandas
Tengo que analizar mi directorio y trazar un montón de CSV. Si el CSV está vacío, la secuencia de comandos se rompe y genera el mensaje de error:
pandas.io.common.EmptyDataError: No columns to parse from file
Si tengo las rutas de mis archivos almacenadas en
file_paths=[]
¿Cómo leo cada uno y solo trazo los CSV no vacíos? Si tengo un marco de datos vacío definido como df=[], intento el siguiente código
for i in range(0,len(file_paths)): if pd.read_csv(file_paths[i] == ""): print "empty" else df.append(pd.read_csv(file_paths[i],header=None))
Simplemente atraparía la excepción apropiada, ya que no se recomienda atrapar todo en python:
import pandas.io.common for i in range(0,len(file_paths)): try: pd.read_csv(file_paths[i]) except pandas.io.common.EmptyDataError: print file_paths[i], " is empty"
Tenga en cuenta que, a partir de pandas 0.22.0 (de lo que puedo estar seguro), la excepción planteada para csv vacío es pandas.errors.EmptyDataError
. Y si está importando pandas como import pandas as pd
, use pd
en lugar de pandas
.
Si sus nombres de archivo csv están en una matriz manyfiles
, entonces
import pandas as pd for filename in manyfiles: try: df = pd.read_csv(filename) except pd.errors.EmptyDataError: print('Note: filename.csv was empty. Skipping.') continue # will skip the rest of the block and move to next file # operations on df
No estoy seguro de si pandas.io.common.EmptyDataError
sigue siendo válido o no. No se puede encontrar en los documentos de referencia. Y también desaconsejaría el cajón de sastre except:
ya que no podrá saber si es otra cosa la que causa el problema.
Puede usar la sintaxis incorporada de try
y except
para omitir los archivos que le devuelven un error, de la siguiente manera:
Descrito aquí: Try/Except in Python: ¿Cómo ignora correctamente las excepciones?
for i in range(0,len(file_paths)): try: pd.read_csv(file_paths[i]) ### Do Some Stuff except: continue # or pass
Esto intentará leer cada archivo y, si no tiene éxito, continuará con el siguiente archivo.