on me donne cet ensemble de données:Obtenez la meilleure caractéristique qui donne le plus grand
https://archive.ics.uci.edu/ml/machine-learning-databases/car/car.data
Je dois obtenir la meilleure fonctionnalité basée sur le fait qu'il a le plus grand gain d'information. Je le faisais manuellement. Mais y a-t-il un moyen de le calculer en utilisant sklearn ou une autre bibliothèque?
Juste pour la référence que j'écrivais ce code:
false_count=0.0;
true_count=0.0;
total=0.0;
for x in range(0, len(y_train)):
if y_train[x]==2:
false_count=false_count+1;
total=total+1;
else:
true_count=true_count+1
total=total+1
Entropy = -(true_count/total)*(math.log((true_count/total))/math.log(2))-(false_count/total)*(math.log((false_count/total))/math.log(2))