2012-06-15 4 views
0

Je tente actuellement de fusionner deux jeux de données dans R (en utilisant Rstudio).Fusion de jeux de données dyadiques et monadiques dans R

Le premier ensemble de données est dyadique et consiste en des flux commerciaux bilatéraux entre pays (dyad) provenant de l'ensemble de données Correlates of War. La seconde est constituée par les données monadiques du PIB de chaque pays tirées des Penn World Tables. Je voudrais savoir comment fusionner les jeux de données de sorte que chaque dyade ait le PIB du pays 1 et le PIB du pays 2.

Les deux ensembles de données sont codés selon les isocodes à 3 caractères. Le premier jeu de données dyadiques a les colonnes suivantes: Pays1, pays2, flux1, flux2, distance

Le deuxième ensemble de données monadiques a le pays et le PIB.

Je voudrais ajouter les données du PIB afin que le nouvel ensemble de données sera maintenant: Pays1, pays2, flux1, flux2, distance, gdp1, gdp2.

Est-ce que quelqu'un sait comment je peux fusionner ces ensembles dans R?

Merci à l'avance =)

Répondre

1

Vous devez envoyer un échantillon réplicable de vos données si vous voulez une réponse spécifique. Cela devrait fonctionner pour les dyades dirigées et non dirigées. En supposant que vos codes de pays pour la df dyadique sont ccode1 et ccode2 et vos dfs sont nommés respectivement dy.df et mon.df.

new.df <- merge(dy.df, mon.df, by = c('ccode1', 'year'), all.x = TRUE) 
new.df <- merge(dy.df, mon.df, by = c('ccode2', 'year'), all.x = TRUE) 

Ensuite, vous pouvez nettoyer votre jeu de données à partir de là. Etes-vous sûr d'avoir des codes ISO? La plupart des trucs de COW utilise des codes COW, pas des codes ISO. Je vous suggère également de lire la documentation sur la commande merge. help(merge).

Questions connexes