Brisons-le:
(RT|via)
- Match « RT » ou « via »
Tout le reste est un groupe non-capture défini par (?:)
, ce qui signifie que nous vérifions qu'il existe, mais nous n » t le capturer.
(?:\\b\\W*@\\w+)+)
\\b
est une limite de mot
\\W*
est un caractère non-mot. *
moyens de jeu égal à 0 ou plus
correspondant à un @
\\w+
et un ou plusieurs caractères de texte (lettre, un chiffre, un connecteur)
+
extérieur du groupe non-capture signifie qu'il peut y avoir plus d'un de ces groupes non-capturant.
Fondamentalement, vous correspondant « via » ou « RT » et le retirer (via le « » vide vous remplacez le texte capturé avec), et correspondant à la capture, mais pas tout le reste qui suit
Le non -capturing group est utilisé pour que vous puissiez faire correspondre "RT" ou "via" dans différentes positions de la chaîne. \\b\\W*@\\w+
s'assure que vous correspondez à un nom d'utilisateur twitter après le "RT" ou "via". Cela devrait aider à éviter de remplacer "RT" ou "via" quand il n'est pas utilisé comme un re-tweet réel.
C'était un très elaboarte et une réponse appropriée à la question, merci @ Mako212. Merci pour l'effort! Pourriez-vous partager les liens/ressources possibles qui vous ont aidé avec l'information? –
@KrishnaDhruv Bien sûr, [Rexegg.com] (http://www.rexegg.com/regex-quickstart.html) est une ressource fantastique pour Regex. Je l'ai trouvé très utile dans l'apprentissage des bases, et toutes les expressions clés sont commodément organisées dans des tableaux de référence. – Mako212
Génial. Merci encore :) –