les plus courants d'une chaîne:2-grammes en utilisant python
this is a test this is
Comment puis-je trouver les 2-grammes top-n les plus courantes? Dans la chaîne ci-dessus, les 2-grammes sont:
{this is, is a, test this, this is}
Comme vous pouvez le remarquer, le 2-gramme this is
apparaît 2 fois. D'où le résultat doit être:
{this is: 2}
Je sais que je peux utiliser la méthode Counter.most_common()
pour trouver les éléments les plus communs, mais comment puis-je créer une liste de 2-grammes de la chaîne pour commencer?
Montrez-nous un peu de code! – Astrom