J'ai un ensemble de déclarationsRechercher dans une chaîne à partir d'une liste de mots clés et mots-clés tag qui se produisent
statement <- as.matrix(c("the cat sat on the mat",
"the dog ran up the hill",
"the dog ran up the hill to the mat"))
et une liste de mots-clés
keywords <- as.matrix(c("cat", "mat", "dog", "hill"))
Je veux effectuer une recherche dans la déclarations de ma liste de mots-clés et tag ce que les mots-clés se produisent à savoir avoir le résultat
statement keywords
the cat sat on the mat cat, mat
the dog ran up the hill dog, hill
the dog ran up the hill to the mat dog, hill, mat
Je pense d'une façon que je peux le faire est d'utiliser grep d'une manière comme
statement[grep("cat", statement$V1, ignore.case = TRUE), "keywords"] <- "cat"
statement[grep("mat", statement$V1, ignore.case = TRUE), "keywords"] <- "mat"
... et ainsi de suite, mais d'une part, qui ne me donne pas tag pour tous les mots-clés qui se produisent. Deuxièmement, si j'essaie de trouver un moyen de le faire quand j'ai une grande liste de 1000 mots-clés et 500 déclarations, il sera juste difficile à manier.
Comment pourriez-vous suggérer une à ce sujet? Existe-t-il un moyen d'utiliser grep ou existe-t-il des paquets qui peuvent extraire du texte et renvoyer des mots-clés à partir d'une liste prédéterminée?
Merci!
Est-il nécessaire que ceux-ci soient des objets matriciels? Ou les vecteurs seraient-ils suffisants? – Benjamin
vecteurs @benjamin serait suffisant dans ce cas –
@DarshanBaral merci! Ceci est vraiment utile –