J'ai une base de données pandas qui contient des requêtes et des comptes pour une période de temps donnée et j'espère convertir cette base de données en un nombre de mots uniques. Par exemple, si la base de données contient le code suivant:Comptage des mots dans une colonne de chaînes dans les pandas
query count
foo bar 10
super 8
foo 4
super foo bar 2
Je souhaite recevoir l'image ci-dessous. par exemple. le mot «foo» apparaît exactement 16 fois dans le tableau.
word count
foo 16
bar 12
super 10
Je travaille avec la fonction ci-dessous, mais il ne semble guère être la meilleure façon de le faire et il ne tient pas compte du nombre total pour chaque ligne.
def _words(df):
return Counter(re.findall(r'\w+', ' '.join(df['query'])))
Toute aide sera grandement appréciée.
Merci d'avance!
'Option 1 'est une pure beauté! – MaxU
Prendre des notes :) – Vaishali
Wow, merci pour toutes les réponses détaillées! L'option 1 fonctionne très bien. Merci beaucoup – Seano314