2009-06-09 7 views
14

Je cherche une implémentation Java de l'arbre Suffixe Généralisée (TPS) avec les caractéristiques suivantes:Généralisée Suffixe Arbre Java Application

Après la création de la TPS de dire 1000 chaînes Je voudrais savoir combien de ces 1000 chaînes contiennent d'autres chaînes.

La recherche doit être calme rapide, que je dois appliquer la recherche sur environ 100'000 chaînes candidats de longueur moyenne 10.

+0

Salut, je me demandais si vous pouviez me dire quelle soulution avez-vous utilisé à la fin, j'ai le même problème !!! – Julia

+0

regardez ici: http://stackoverflow.com/questions/9452701/ukkonens-suffix-tree-algorithm-in-plain-english/9513423#9513423 – YAMM

Répondre

4

Essayez The Semantic Discovery Toolkit. Il a une mise en œuvre sur le texte/src/java/org/sd/text/radixtree

+0

Er, connaissez-vous des implémentations (ou même des tutoriels!) pour les arbres Suffix Token? –

3

J'ai créé un arbre suffixe en Java Cela vous permet d'ajouter facilement votre propre fonctionnalité de recherche et d'autres algorithmes correspondants. Mon article de blog, Suffix Trees in Java, a un aperçu ainsi que des instructions pour télécharger la dernière version. Mon implémentation Java est basée sur l'article de Mark Nelson.

Mise à jour 2016-06-18

+0

L'article du blog est informatif mais la source n'est pas disponible pour le moment (août 2015) car elle pointe vers https://svn.globalmentor.com/java/trunk/globalmentor-core/ quel mot de passe est protégé. – codeDr

+0

Je fais de mon mieux pour convertir notre dépôt de Subversion en Git et le rendre public à nouveau. Cela devrait arriver dans une semaine ou deux. N'hésitez pas à me contacter si elle n'est pas disponible d'ici là. À votre santé. –

+0

Le code source est maintenant disponible via Git et sur Maven Central. J'ai mis à jour la réponse ci-dessus avec le nouvel emplacement. –