2017-08-22 4 views
-2

Je regarde les puissances étrangères intervenant dans les guerres civiles en utilisant R studio. Ma première unité d'analyse de données est l'année de conflit alors que la seconde est le mois de conflit. Je devrais avoir les deux dans les années de conflit afin que je puisse les fusionner. Y at-il une commande qui vous permet de faire le contraire de l'expansion des lignes?changement d'unité d'analyse pour les données de panel en R

+1

Essayez d'utiliser la pâte – user108363

Répondre

0

Il est difficile de vous donner des détails sans un échantillon de vos données afin que nous sachions quelle est la structure. Je suppose que votre jeu de données au niveau du mois stocke le mois sous la forme d'une chaîne de caractères comprenant une année. Vous devriez être en mesure d'extraire l'année avec séparé du paquet tidyr:

library(tidyverse) 

month <- c("June 2015", "July 2015", "September 2016", "August 2016", "March 2014") 
conflict <- c("A", "B", "C", "D", "E") 

my.data <- data.frame(month, conflict) 

my.data 
      month conflict 
1  June 2015  A 
2  July 2015  B 
3 September 2016  C 
4 August 2016  D 
5  March 2014  E 

my.data <- my.data %>% 
    separate(month, c("month", "year"), sep = " ") 

> my.data 
     month year conflict 
1  June 2015  A 
2  July 2015  B 
3 September 2016  C 
4 August 2016  D 
5  March 2014  E 
+0

Désolé si je ne suis pas assez clair, mais je n'apprendre à peine les notions de base sur R et je suis vraiment du mal même copier et coller le code en gardant le format. –

+0

Mais fondamentalement mon premier ensemble de données inclut une variable de chaîne numérique comme ceci: 0198 (qui se rapporte au mois 01 ou année 98). Il n'y a pas de séparation donc je commence par essayer de soustraire cette variable en deux variables. –

+0

Dans ce cas, lancez exactement le même code mais changez 'sep = 2'. Cela va diviser votre champ entre le deuxième et le troisième caractère, de sorte que vous finirez avec 01 et 98. – mmalloy