2017-10-17 7 views
0

Je dois appliquer une fonction à un sous-ensemble (depth1: depthN sur nm1: nmN) dans ma df qui doit utiliser les deux colonnes (t & s) et les lignes en entrée (profondeur, temp & sal). Mes données réelles ont 170 colonnes par 28-128 lignes. Je voudrais calculer une formule comme:Comment incorporer un LUT dans un funs dplyr?

x = z- [temp * (temp - tdev) + s * sal] 

où z elle les valeurs observées

df <- matrix(c( 
1.0277, 1.0051, 1.0059, 1.003, 1.009, 1.00E-04, -1.20E-05, 
1.0019, 0.9841, 0.9769, 0.9809, 0.9815, 9.00E-05, -1.80E-05, 
0.9755, 0.9601, 0.9531, 0.9587, 0.955, 6.00E-05, -2.00E-05, 
0.9522, 0.9364, 0.9296, 0.9322, 0.931, 2.00E-05, -2.00E-05, 
0.2, 0.4, 0.6, 0.8, 1, NA, NA, 
15.327, 15.336, 15.356, 15.342, 14.853, NA, NA, 
14.908, 14.916, 14.912, 14.9, 17.95, NA, NA 
), nrow = 7, ncol = 7, byrow = TRUE, 
dimnames = list(c("nm1","nm2","nm3","nm4","depth","temp","sal"), 
      c("depth1","depth2","depth3","depth4","depth5","t","s"))) 


    df 
     depth1 depth2 depth3 depth4 depth5  t   s 
nm1 1.0277 1.0051 1.0059 1.003 1.009 1.00E-04 -1.20E-05 
nm2 1.0019 0.9841 0.9769 0.9809 0.9815 9.00E-05 -1.80E-05 
nm3 0.9755 0.9601 0.9531 0.9587 0.955 6.00E-05 -2.00E-05 
nm4 0.9522 0.9364 0.9296 0.9322 0.931 2.00E-05 -2.00E-05 
depth 0.2  0.4  0.6  0.8  1  NA   NA 
temp 15.327 15.336 15.356 15.342 14.853 NA   NA 
sal 14.908 14.916 14.912 14.95 17.95 NA   NA 

Je pensais qu'il pourrait être préférable d'avoir les lignes utilisées dans l'équation (profondeur, température & sal) dans un autre df (DF2) et les déposer de la première avec des variables correspondant DEPTH1: DepthN et utiliser comme LUT comme ci-dessous:

nm <- c("nm1", "nm2","nm3","nm4") 
df1<-df[nm, ] 

df1 
     depth1 depth2 depth3 depth4 depth5  t   s 
nm1 1.0277 1.0051 1.0059 1.003 1.009 1.00E-04 -1.20E-05 
nm2 1.0019 0.9841 0.9769 0.9809 0.9815 9.00E-05 -1.80E-05 
nm3 0.9755 0.9601 0.9531 0.9587 0.955 6.00E-05 -2.00E-05 
nm4 0.9522 0.9364 0.9296 0.9322 0.931 2.00E-05 -2.00E-05 

list2 <- c("depth", "temp","sal") 
df2 <- subset(df,rownames(df) %in% list2, select = depth1:depth5) 

df2 depth1 depth2 depth3 depth4 depth5 
depth 0.2  0.4  0.6  0.8  1  
temp 15.327 15.336 15.356 15.342 14.853 
    sal 14.908 14.916 14.912 14.95 17.95 

J'ai essayé en dplyr, avec succès:

tdev <- 17.2 
    df3<-transmute_at(df, vars(depth1:depth5), funs(.-abs(t*(df2[2,]- tdev)+s*df2[3,]))) 

Quelqu'un at-il une solution pour cela?

Répondre

0

Cela a besoin de quelques données rangeait:

library(tidyverse) 
df <- as.data.frame(df) %>% 
    rownames_to_column %>% 
    as_tibble #convert to tibble (not sure why you'd want a matrix?) 

Voici donc ce que je suppose que vous avez besoin ... Je ne sais pas si t et TDEV sont la même chose et si vous avez besoin de regroupement ou non.

df %>% 
    dplyr::filter(rowname != "depth", 
       rowname != "temp", 
       rowname != "sal") %>% 
    gather(var, z, -rowname, -t, -s) %>% ## filter from wide to long (i.e. tidy) format 
    full_join(df %>% 
       dplyr::select(-t, -s) %>% 
       dplyr::filter(!grepl("nm", rowname)) %>% 
       gather(var, val, -rowname) %>% 
       spread(key = rowname, val)) %>% ## join to the rest of your df 
    mutate(x = z- (temp * (temp - t) + s * sal)) 
+0

OUI! Merci @biomiha! C'est vraiment ce que je voulais, je ne savais pas comment transformer la df en un format long d'une manière facile et puis je pensais à un LUT pour le contourner. t sont pris à partir de la df mais tdev est une constante avec une valeur fixe donc pour la dernière ligne que je devrais faire: 'muter (x = z- (t * (temp - tdev) + s * sal)). Merci encore, cela me fait gagner beaucoup de temps dans le traitement de mes données! –