2017-10-10 8 views
0

J'essaye d'exécuter la fonction de stemmer sur un ensemble de données (téléchargé par l'intermédiaire du paquet de data.table) dans R de autour de 40000 rangées, mais il prend l'éternité pour courir. Mon code ressemble à ceci:Fonction Stemmer dans R Lent

data[, Description := map(Description, function(k) stemmer(k))] 

Si arrêter manuellement le processus, il montre plus de 50 avertissements que: Image Link

est-il une alternative à l'exécuter plus rapidement. Mon ordinateur a 8 Go de RAM.

+0

égrappoir en général prend beaucoup de temps, avez-vous vérifié la différence de temps pour courir dire 10 dossiers? –

+0

Yeah courir sur 10 lignes est plus rapide mais quelle est l'alternative, comment puis-je le faire pour l'ensemble des données ?? –

+0

essayez de l'exécuter en batch, stemmer prend beaucoup de temps wen vous utilisez un grand ensemble de données. avez-vous essayé lapply? –

Répondre

0

Utilisez lapply, votre fonction tournera plus vite