Tengo una carpeta de archivos de Excel que contienen varias hojas cada uno. Las hojas se nombran igual en cada wb. Estoy tratando de importar una hoja con nombre específico para todos los archivos de Excel como marcos de datos separados. He podido importarlos en; sin embargo, los nombres se convierten en df_1, df_2, df_3, etc... He estado tratando de tomar la primera palabra del nombre del archivo de Excel y usarla para identificar el df.
Ejemplo de archivo de Excel Nombre "AAPL Multiple Sheets" la hoja se llamaría "Balance" que estoy importando como df. Me gustaría "AAPL Balance df" como resultado.
Sin embargo, el código que se acercó más a lo que busco se encuentra a continuación y nombra cada marco de datos como df_1, df_2, etc.
library(purrr) library(readxl) files_list <- list.files(path = 'C:/Users/example/Drive/Desktop/Total_Related_Data/Analysis of Data/', pattern = "*.xlsx",full.names = TRUE) files_list %>% walk2(1:length(files_list), ~ assign(paste0("df_", .y), read_excel(path = .x), envir = globalenv()))
Intenté usar la variable de ruta de archivo 'file_list' en la función past0 para etiquetarlos y terminé con,
df_C:/Users/example/Drive/Desktop/Total_Related_Data/Análisis de datos/.xlsx1, df_C:/Users/example/Drive/Desktop/Total_Related_Data/Análisis de datos/.xlsx2,
y así.
Traté de hacer una lista de nombres de archivos para usar. Esto leyó los nombres de los archivos y creó una lista, pero no pude hacerlo funcionar con el código anterior.
files_Names<-list.files(path='C:/Users/example/Drive/Desktop/Total_Related_Data/Analysis of Data/', pattern=NULL, all.files=FALSE, full.names=FALSE)
Lo que resultó con esto, "Análisis AAPL de Data.xlsx" para todos los archivos en la lista.
Espero poder reproducir tu ejemplo sin código. Crearía una función para tener más control sobre el nuevo nombre de archivo.
Yo sugeriría:
library(purrr) library(readxl) library(openxlsx) target_folder <- 'C:/Users/example/Drive/Desktop/Total_Related_Data/Analysis of Data' files_list <- list.files(path = target_folder, pattern = "*.xlsx", full.names = TRUE) tease_out <- function(file) { data <- read_excel(file, sheet = "Balance") filename <- basename(file) %>% tools::file_path_sans_ext() new_filename <- paste0(target_folder, "/", fileneame, "Balance df.xlsx") write.xlsx(data, file = new_filename) } map(file_list, tease_out)
Déjame saber si funciona. ¿Supongo que solo está apuntando a la hoja "Saldo"?
Puede hacer lo siguiente (tenga en cuenta que estoy usando el paquete openxlsx para leer archivos de Excel, pero puede reemplazar esa parte con readxl, por supuesto):
library(openxlsx) library(tidyverse) Starting with your `files_list` we can do: # using lapply to read in all files and store them as list elements in one list list_of_dfs <- lapply(as.list(files_list), function(x) readWorkbook(x, sheet = "Balance")) # Create a vector of names based on the first word of the filename + "Balance" # Note that we can't use empty space in object names, hence the underscore df_names <- paste0(str_extract(basename(files_list), "[^ ]+"), "_Balance_df") # Assign the names to our list of dfs names(list_of_dfs) <- df_names # Push the list elements (ie data frames) to the Global environment # I highly recommend NOT doing this. I'd say in 99% of the cases it's better to continue working in the list structure or combine the individual dfs into one large df. list2env(list_of_dfs, env = .GlobalEnv)