Je dispose d'un fichier comme ceci:Comment puis-je supprimer tous les caractères autres que les mots, sauf le saut de ligne?
my line - some words & text
oh lóok i've got some characters
Je veux « normaliser » et supprimer tous les caractères non-mot. Je veux finir avec quelque chose comme ceci:
mylinesomewordstext
ohlóokivegotsomecharacters
J'utilise Linux sur la ligne de commande pour le moment, et j'espère qu'il ya une seule ligne que je peux utiliser.
J'ai essayé:
cat file | perl -pe 's/\W//'
Mais qui a supprimé toutes les nouvelles lignes et tout mettre une ligne. Y a-t-il un moyen de dire à Perl de ne pas inclure de nouvelles lignes dans le \W
? Ou y a-t-il un autre moyen?
Ceci supprime le o accentué dans le texte original. –
Vous devrez ajouter un drapeau à la commande pour l'obtenir Unicode conscient -C devrait le faire. http://perldoc.perl.org/perlrun.html#Command-Switches –
Droit, changé cela. – sth