Je voulais regrouper mon ensemble de données à l'aide de l'atelier carotte2. J'ai un fichier xml d'entrée avec 65536
documents. J'utilise l'algorithme de classification Lingo.L'atelier Carrot2 ne pouvait pas traiter de grandes données
Mais lorsque je lance le processus, le plan de travail renvoie le résultat en quelques secondes avec tous les documents du groupe "Autres sujets".
J'ai vérifié le clustering avec des ensembles de données plus petits et j'obtiens les résultats.