-1

Comment extrapoler un échantillon de 10 000 lignes à la population entière (100 000) en python. J'ai fait un regroupement agglomératif sur l'échantillon en python, coincé avec l'extrapolation du résultat à l'ensemble de la population.Extrapolation de l'échantillon à la population

+0

Pouvez-vous [poster du code que vous utilisez] (http://stackoverflow.com/help/mcve) et montrer où cela ne fonctionne pas? – techturtle

Répondre

0

Il n'y a pas de règle générale.

Pour la classification hiérarchique, ce dépend beaucoup de votre lien et le regroupement d'un échantillon différent ou l'ensemble de la population peut être très différents. (Pour un démarreur, essayez un échantillon différent et comparez!)

Généraliser un résultat de regroupement à de nouvelles données est généralement en contradiction avec les hypothèses mêmes faites pour la mise en grappe. Ce n'est pas une classification, mais une analyse de données exploratoire.

Cependant, si vous avez trouvé bons résultats de clustering, et vous les avez vérifié souhaitable, alors vous pouvez former un classificateur sur les étiquettes groupe pour prédire l'étiquette de groupe de nouvelles données.