Je n'arrive pas à comprendre ce que signifient les expressions régulières dans les lignes de code suivantes.l'analyse de l'expression régulière pour sub et gsub dans r
author = "10_1 A Kumar; Ahmed Hemani ; Johnny Öberg<"
# after some experiment, it looks like this line captures whatever is in
# front of the underscore.
authodid = sub("_.*","",author)
# this line extracts the number after the underscore, but I don't know
# how this is achieved
paperno <- sub(".*_(\\w*)\\s.*", "\\1", author)
# this line extracts the string after the numbers
# I also have no idea how this is achieved through the code
coauthor <- gsub("<","",sub("^.*?\\s","", author))
j'ai lu sur la bande que le premier argument est le motif, le deuxième est le remplacement, et le troisième est l'objet à opérer. J'ai également vu quelques post sur SO et appris que \\w
signifie le mot et \\s
est un espace.
Cependant, certaines choses ne sont toujours pas claires. \\w
signifie mot, cela signifie-t-il le mot suivant? Sinon, comment dois-je l'interpréter? J'ai appris que ^
correspond au début de la chaîne, mais qu'en est-il de la période après ^
?
Plus important encore, quelle est l'interprétation de _.*
Qu'en est-il .*_
Que diriez-vous de ^.*?\\s
? Comment devrais-je les lire?
Merci!
tapez ces choses ici https://regex101.com – rawr
@rawr Quelle saveur devrais-je choisir? Il semble que tous montrent une erreur. – Waht
[pcre devrait être bien] (https://regex101.com/r/sIb7Ql/1), je ne reçois pas d'erreur, peut-être que vous faites à cause du double \ qui ne sont pas nécessaires lorsque vous utilisez ce site Web – rawr