Nxirrni kornizat e të dhënave nga lista dhe emërtoni ato

Unë kam një listë të kornizave të të dhënave me temperatura mesatare ditore nga disa vende. Çdo kornizë e të dhënave është e gjatë 360-365 hyrje dhe duket diçka si kjo

Airport	Day	Average
RJOO	1998-01-01	12

E bëra listën nga disa grupe të dhënash në mënyrë që të mund të kryeja llogaritjet mbi to të gjitha menjëherë si

weathers<-list(France, Greece)

Do të doja të isha në gjendje t'i tërheq dhe t'i ruaj si skedarë të rinj. Në këtë rast do të thoshte të kishim dy të quajtur Francë dhe Greqi. Më së shumti që kam mundur të bëj është të krijoj një kolonë të re me emrin në çdo hyrje.

r list dataframe

25.06.2021

Nuk e kam të qartë se cili është qëllimi juaj këtu. Keni bërë një listë të kornizave të të dhënave duke përdorur weathers<-c(France, Greece) dhe tani doni të nxirrni kornizat e të dhënave nga weathers? 25.06.2021

Përgjigjet:

këtu po ndodhin disa gjëra. Ju mund të gjeni shumë miq, nëse jepni një shembull të riprodhueshëm dhe na tregoni se ku shkojnë gjërat keq. Më poshtë është një qasje e bazuar në {tidyverse}. Funksionon me krijimin e një tabele të mbivendosur për secilin nga vendet tuaja. Shpresoj se do t'ju çojë atje ku dëshironi të shkoni dhe ju mund ta përshtatni atë me problemin tuaj.

1.) filloni Si ushtrimi i parë lidhni kornizat tuaja të ndryshme të të dhënave në një të madhe. Unë simuloj disa të dhëna për të krijuar një kornizë të dhënash. Lexoni se si ta bëni këtë, nëse kjo tashmë është një problem për ju.

library(tidyverse)
set.seed(666) # set seed and simulate data ---------------------------------
Airport <- rep(c("RJOO","LFPG","EHAM"), 5)
Day <- sample(c( as.POSIXct("1998-01-01")
                 ,as.POSIXct("1998-01-02")
                 ,as.POSIXct("1998-01-03") ), 15, replace = TRUE)
Average <- sample(c(12:25), 15, replace = TRUE)

df <- tibble(Airport, Day, Average)

Kjo jep:

df
# A tibble: 15 x 3
   Airport Day                 Average
   <chr>   <dttm>                <int>
 1 RJOO    1998-01-02 00:00:00      19
 2 LFPG    1998-01-02 00:00:00      18
 3 EHAM    1998-01-03 00:00:00      13
 4 RJOO    1998-01-03 00:00:00      12
 5 LFPG    1998-01-02 00:00:00      21
 6 EHAM    1998-01-01 00:00:00      17
 7 RJOO    1998-01-01 00:00:00      19
 8 LFPG    1998-01-01 00:00:00      20
 9 EHAM    1998-01-02 00:00:00      15
10 RJOO    1998-01-03 00:00:00      22
11 LFPG    1998-01-01 00:00:00      24
12 EHAM    1998-01-01 00:00:00      19
13 RJOO    1998-01-03 00:00:00      21
14 LFPG    1998-01-03 00:00:00      19
15 EHAM    1998-01-02 00:00:00      18

2.) shoqërimi i emrave të shteteve nuk është e qartë nga shembulli juaj se si i lidhni emrat e shteteve. Unë supozoj se ju e dini rrugën tuaj. Treguesit e vendndodhjes së aeroportit ICAO (në thelb 2 shkronjat e para ose të para) ju japin vendin. Nëse keni një tabelë kërkimi, mund të bashkoni treguesin e vendndodhjes (kodi me 4 shkronja, RJOO) me shtetin. Ju mund të bashkoni tabelat e kërkimit me left_join() të {dplyr}.

Duke qenë dembel përdor një case_when() për t'u rrokullisur. padyshim, mund t'ju duhet ta bëni këtë ndryshe.

# associate country names with data
df <- df %>% 
  mutate(Country = case_when(    # a lazy look up for country name creation -----
                  Airport == "RJOO" ~ "Japan"
                , Airport == "LFPG" ~ "France"
                , Airport == "EHAM" ~ "Netherlands"
                , TRUE ~ as.character(NA) )
   ) #----------------------------------------------------------------------------

Ju e dini se keni sa vijon:

# A tibble: 15 x 4
   Airport Day                 Average Country    
   <chr>   <dttm>                <int> <chr>      
 1 RJOO    1998-01-02 00:00:00      19 Japan      
 2 LFPG    1998-01-02 00:00:00      18 France     
 3 EHAM    1998-01-03 00:00:00      13 Netherlands
 4 RJOO    1998-01-03 00:00:00      12 Japan      
 5 LFPG    1998-01-02 00:00:00      21 France     
 6 EHAM    1998-01-01 00:00:00      17 Netherlands
 7 RJOO    1998-01-01 00:00:00      19 Japan      
 8 LFPG    1998-01-01 00:00:00      20 France     
 9 EHAM    1998-01-02 00:00:00      15 Netherlands
10 RJOO    1998-01-03 00:00:00      22 Japan      
11 LFPG    1998-01-01 00:00:00      24 France     
12 EHAM    1998-01-01 00:00:00      19 Netherlands
13 RJOO    1998-01-03 00:00:00      21 Japan      
14 LFPG    1998-01-03 00:00:00      19 France     
15 EHAM    1998-01-02 00:00:00      18 Netherlands

3.) korniza e të dhënave të mbivendosur Krijimi i një kornize të të dhënave të mbivendosur është i thjeshtë.

df <- df %>% group_by(Country) %>% nest()
df
# A tibble: 3 x 2
# Groups:   Country [3]
  Country     data            
  <chr>       <list>          
1 Japan       <tibble [5 x 3]>
2 France      <tibble [5 x 3]>
3 Netherlands <tibble [5 x 3]>

4.) duke përdorur një tabelë të ndërthurur për të shkruar pjesët Fillimisht ne krijojmë një funksion që na ndihmon të shkruajmë pjesën e vendit të kornizës së të dhënave/tibble tonë.

# utility function to write out country parts
write_country <- function(.ctry, .data){
  fn <- paste0(.ctry, ".csv")   # construct a filename to your liking
  readr::write_csv(.data, fn) 
}

# as we write out and the function does not return
# we use purrr's walk instead of map to iterate over the nested data
walk2( .x = df$Country       # you have 2 variables, thus use walk2
     , .y = df$data          # define .x and .y vector
     , .f = ~ write_country(.x, .y)  # supply your function, watch the tilde ~
)

# you will now see 3 csv files: Japan.csv, France.csv, and Netherlands.csv

Kjo recetë duhet të funksionojë për ju. Vetëm sigurohuni që të përcaktoni emrin e skedarit duke marrë parasysh strukturën e dosjes dhe vendin ku dëshironi ta ruani atë, etj.

25.06.2021

Bëra sa vijon: Kisha një listë vetëm me emrat e skedarëve që fillimisht i përdora për të importuar CSV-të e paredaktuara në radhë të parë.

filenames <- gsub("\\.csv$","", list.files(pattern="\\.csv$")) 
for(i in filenames){
assign(i, read.csv(paste(i, ".csv", sep="")))
}

Ju ndoshta mund ta bëni këtë në një mënyrë tjetër nëse i importoni ato ndryshe si diçka e tillë

filenames<-c("France", "Greece")

airport="LFMD"
days=as.Date("1988-2-15")
temperature=3
France<-data.frame(airport,days,temperature)


airport2="LGEL"
days2=as.Date("1994-1-11")
temperature2=15
Greece<-data.frame(airport2,days2,temperature2)

mylist<-list(France, Greece)

Pasi ta kaloni këtë nëpër disa funksione, për të ruajtur ato të redaktuara në skedar

    for(i in 1:length(filenames)){
  write.csv(mylist[[i]], file = paste0("D:/Weather/Modified/", filenames[i],".csv"), row.names = TRUE)
}

E cila më jep skedarët e ruajtur me emrat që dëshiroj.

29.06.2021

Materiale të reja

Masterclass Coroutines: Kapitulli-3: Anulimi i korutinave dhe trajtimi i përjashtimeve.

Mirë se vini në udhëzuesin gjithëpërfshirës mbi Kotlin Coroutines! Në këtë seri artikujsh, unë do t'ju çoj në një udhëtim magjepsës, duke filluar nga bazat dhe gradualisht duke u thelluar në..

Faketojeni derisa ta arrini me të dhënat false

A e gjeni ndonjëherë veten duke ndërtuar një aplikacion të ri dhe keni nevojë për të dhëna testimi që duken dhe duken më realiste ose një grup i madh të dhënash për performancën e ngarkesës...

Si të përdorni kërkesën API në Python

Kërkesë API në GitHub për të marrë depot e përdoruesve duke përdorur Python. Në këtë artikull, unë shpjegoj procesin hap pas hapi për të trajtuar një kërkesë API për të marrë të dhëna nga..

Një udhëzues hap pas hapi për të zotëruar React

Në këtë artikull, do të mësoni se si të krijoni aplikacionin React, do të mësoni se si funksionon React dhe konceptet thelbësore që duhet të dini për të ndërtuar aplikacione React. Learning..

AI dhe Psikologjia — Pjesa 2

Në pjesën 2 të serisë sonë të AI dhe Psikologji ne diskutojmë se si makineritë mbledhin dhe përpunojnë të dhëna për të mësuar emocione dhe ndjenja të ndryshme në mendjen e njeriut, duke ndihmuar..

Esencialet e punës ditore të kodit tim VS

Shtesat e mia të preferuara - Git Graph 💹 Kjo shtesë është vërtet e mahnitshme, e përdor përpara se të filloj të punoj për të kontrolluar dy herë ndryshimet dhe degët më të fundit, mund të..

Pse Python? Zbulimi i fuqisë së gjithanshme të një gjiganti programues

Në peizazhin gjithnjë në zhvillim të gjuhëve të programimit, Python është shfaqur si një forcë dominuese. Rritja e tij meteorike nuk është rastësi. Joshja e Python qëndron në thjeshtësinë,..

Etiketa

Machine Learning JavaScript Data Science Artificial Intelligence Python Web Development Software Development Coding Deep Learning AI React Programming Languages Software Engineering Java Nodejs Algorithms Front End Development Data Tech Computer Science Development AWS HTML CSS Neural Networks Angular ChatGPT Python Programming Learning To Code Developer Code Typescript Tutorial NLP Open Source Productivity Computer Vision Linear Regression