J'ai trouvé quelques messages ici suggérant des solutions en utilisant awk
et sed
, mais aucun d'entre eux semble faire le travail. Soit la ligne entière est supprimée, soit rien n'est supprimé. Je ne suis pas non plus en ligne de commande et mes connaissances sont limitées, alors j'ai décidé de demander de l'aide ici. Peu importe la solution, que ce soit awk
, grep
, sed
... Honnêtement, je ne peux pas faire de différence dans ce cas, donc ce sera tout ce que vous ressentez dans ce cas.Comment supprimer un mot d'un fichier texte contenant X nombre de caractères?
Ce que j'est plusieurs fichiers avec quelques millions de lignes, et les fichiers/lignes ressembler à quelque chose comme ceci:
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
50somethingcharactergibberish shortrword
Et cela vaut pour plusieurs millions de lignes. Ce que j'ai besoin de faire, c'est d'enlever le 50somethingcharactergibberish et ne laisser que le mot court. Le problème est aussi qu'il n'y a pas de modèle, le mot long en question commence parfois par une lettre, et parfois par un nombre. Donc je suppose que je devrai compter les personnages par la suite.
Y a-t-il toujours deux mots de ce genre dans toutes les lignes du fichier? – Inian
Merci pour votre réponse Inian. Oui, il n'y a que les mots sur chaque ligne. Il y a un espace entre les sapins et le deuxième mot. Sinon, la même chose des millions de fois. – mrBlob