Existe-t-il un moyen facile de supprimer les balises HTML d'une chaîne de caractères dans R?Supprimer les balises HTML de la chaîne (Programmation R)
Actuellement, j'extrais des données d'enquête à partir d'un document XML et, pour le titre de la question, j'ai le code HTML du plan de sondage, comme ceci.
"Why did you give this performance question a low score?<br />"
Toute façon d'enlever facilement le <br />
?
Toute aide serait appréciée.
Merci pour cela, il m'a fait sur mon chemin pour trouver « gsub (« <(.|\n)*?> », « », string) » –
Juste pour marquer, il peut être utile de consulter ce sage conseil au sujet de regex pour l'analyse syntaxique html .. http://stackoverflow.com/a/1732454/1156245 – geotheory