Je ne pouvais pas résister à essayer RapidMiner à cet effet. J'ai créé un ensemble de deviates gaussiens aléatoires avec ce script.
>>> import random
>>> with open('gaussian.txt', 'w') as gaussian:
... for n in range(100):
... _ = gaussian.write(str(random.gauss(0,1))+'\n')
J'ai utilisé la version gratuite de RapidMiner Studio.
J'ai chargé les données en suivant le bouton Add Data
. Ensuite, j'ai 'conçu' mon calcul dans le volet 'Process', comme ceci.
Pour obtenir ce que vous faites glisser-déposer l'ensemble de données « Récupérer gaussienne » dans le volet gauche près du sommet, et le « Discrétiser » dans le volet inférieur gauche. J'ai trouvé qu'un formulaire de recherche facilitait la recherche de ce dernier élément en utilisant 'binning' comme terme de recherche.
J'ai défini 'taille des casiers' pour 'Discrétiser' et connecté deux composants entre eux et le 'res' qui semble signifier 'sortie'.
Les résultats ont inclus cette information.
Je ne peux pas répondre à votre question. Je viens de remarquer que rapidminer a quelques options intéressantes sur ces lignes: https://docs.rapidminer.com/studio/operators/cleansing/binning/discretize_by_frequency.html. –