J'ai un grand fichier texte (plus de 70mb) et j'ai besoin de compter le nombre de fois qu'une séquence de caractères se produit dans le fichier. Je peux trouver beaucoup de scripts pour cela, mais aucun d'entre eux ne prend en compte qu'une séquence peut commencer et finir sur différentes lignes. Par souci d'efficacité (j'ai en fait beaucoup plus de 1 fichier que je suis en train de traiter), je ne peux pas pré-traiter les fichiers pour supprimer les retours à la ligne.Script shell Linux pour compter l'occurrence de la séquence char dans un fichier texte?
Exemple: Si je suis à la recherche de "thisIsTheSequence", le fichier suivant aurait 3 matches:
asdasdthisIsTheSequence
asdasdasthisIsT
heSequenceasdasdthisIsTheSequ
encesadasdasda
Merci pour l'aide.
Vous pouvez prétraiter les fichiers, faire juste dans un pipeline avant le script de comptage: 'bande-retour à la ligne | count-matches'. –