2
A
Répondre
0
J'ai vérifié le ruby-stemmer, et il ne semble pas comme il a l'arabe, mais en regardant le Snowball project que le bijou utilise, vous voudrez peut-être envoyer un courriel leur liste. J'ai cliqué sur un couple, et en regardant le Hungrarian stemmer, ça ne semble pas trop mauvais. Je me demande à quel point il serait difficile pour un Arabe natif de suivre l'exemple de l'une des autres langues et d'essayer de contribuer à un projet en arabe. Je suppose que brancher le gemme ruby-stemmer
serait trivial si le fichier stemmer pour l'arabe était déjà là. Ou un autre itinéraire pourrait être à la recherche d'un fichier arabe stemmer et demander de l'aide pour l'intégrer au projet Snowball.
Questions connexes
- 1. Porter Stemmer et Weka
- 2. Utiliser SQL Server FTS Stemmer
- 3. Itextsharp et caractère arabe?
- 4. arabe encodage avec fenêtres
- 5. arabe WebRequest C#
- 6. Stop-mot élimination et stemmer en python
- 7. Anglais/Arabe Encodage problème
- 8. Arabe taggué Corpora
- 9. convertir l'anglais en arabe
- 10. PHP print() Chaîne arabe
- 11. Traduction arabe pour iPhone
- 12. LWUIT: problème de police arabe
- 13. Word 2007 arabe Macro Remplacer
- 14. Zone de texte en arabe
- 15. Localisation en arabe dans GTK
- 16. Quel mot stemmer devrais-je utiliser dans nltk?
- 17. Ajout de mots à SQL Server Texte intégral Stemmer
- 18. Existe-t-il une implémentation java de Porter2 stemmer
- 19. QT4 QFileSystemWatcher utilisant Ruby
- 20. parsing en utilisant Ruby
- 21. PHP obtenir arabe Contenu de SQL Server
- 22. Problème arabe QueryString (???? dans la valeur)
- 23. Farsi/numéro arabe à sortir correctement
- 24. développer l'application iphone en langue arabe
- 25. Support de texte arabe pour Android Emulator
- 26. Recherche plein texte en arabe dans RoR
- 27. SVG Urdu/Arabe Traitement en Alphabet?
- 28. Ruby C Extension utilisant Singleton
- 29. Afficher le texte arabe de gauche à droite en pdf en utilisant apache fop 0.95
- 30. Utilisation d'un lemmatizer en ruby
Je ne sais pas ce qu'est un stemmer arabe, mais cela semble intéressant. –
Le processus consistant à réduire les mots fléchis (ou parfois dérivés) à leur forme de tige, de base ou de racine (wikipedia). Par exemple, lorsque vous avez un mot comme "player", vous obtenez la racine "play", cela vous aide lorsque vous effectuez des statistiques sur un document. mais j'ai besoin d'un stemmer arabe pour que je puisse analyser des documents arabes: D –