J'ai un énorme ensemble de données, où l'identifiant unique est l'adresse MAC. Le format de MAC est 00-00-0C-12-43-02. J'ai aussi la date en tant qu'attribut. Actuellement, je suis fractionnement de l'ensemble de données en fonction de la colonne de date. Le code que j'utilise est ci-dessous, qui fonctionne.Comment diviser un train et tester des jeux de données en fonction de valeurs uniques?
set.seed(100)
Date <- data.frame(unique(Clean_Data[,5]))
dat_len <- length(unique(Clean_Data[,5]))
Date_Split <- as.integer(dat_len*.70)
train_ind <- Clean_Data[,5] <= Date[Date_Split+1,]
test_ind <- !train_ind
training<- Clean_Data[train_ind,]
testing <- Clean_Data[test_ind,]
Clean_Data est mon ensemble de données, la 5ème colonne est la colonne de date.
Maintenant, mon exigence est de diviser l'ensemble de données par adresse MAC. Mais ça ne fonctionne pas. Puisqu'il s'agit d'une valeur de facteur je ne pourrais pas comparer les valeurs de facteur avec les valeurs de date comme ci-dessus. Y a-t-il une manière différente de faire ceci?