J'ai un vecteur de caractères en russe. Voir le vecteur exemple ci-dessous -Recherche de caractères alphanumériques dans R
x = "nНозологические единицы \r\n В20 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], проявляющаяся в виде \r\nинфекционных и паразитарных болезней \r\n В21 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], проявляющаяся в виде \r\nзлокачественных новообразований \r\n В22 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], проявляющаяся в виде \r\nдругих уточненных болезней \r\n В78.1 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], проявляющаяся в виде \r\nдругих состояний \r\n В24 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], неуточненная \r\n Z21 Бессимптомный инфекционный статус, вызванный вирусом иммунодефицита человека"
Je veux extraire ces valeurs - B20, B21, B22, B78.1, B24, Z21. J'utilise le code ci-dessous -
gsub("[^0-9A-Za-z///' ]", "", x)
Mais il retourne le mauvais résultat.
[1] "n 20 21 22 781 24 Z21 "
voulez-vous toutes les sous-chaînes qui sont au format ASCII aphanumérique? –
oui, je veux toutes les sous-chaînes qui sont au format ASCII aphanumérique – john