2017-10-20 40 views
0

Je réalise mon analyse en utilisant R, je vais mettre en œuvre quatre algorithmes.Tous les prédicteurs binaires dans une tâche de classification

1. RF 
2. Log Reg 
3. SVM 
4. LDA 

J'ai 50 prédicteurs et 1 variable cible. Tous mes prédicteurs et variables cibles ne sont que des nombres binaires 0 et 1.

J'ai les questions suivantes:

Should I convert them all into factors? 
Converting them into factors, and applying RF algorithms give 100% accuracy, I am very much surprised to see that as well. 
Also, for other algorithms, how should i treat my variables priorly, before feeding them into my other algorithms. 

Merci

+0

https://stats.stackexchange.com/a/112052/1569 –

+0

@HongOoi, Même avec les données de test. – Shivam

Répondre

2

Si vous variables/facteurs prédictifs sont catégoriques, alors il est préférable de les convertir à des facteurs. Sinon, il est probable qu'ils seront traités comme des valeurs numériques.

Si vous effectuez une tâche de classification, il est préférable d'utiliser la variable cible/réponse comme facteur.

Il est également préférable de consulter la documentation des fonctions que vous utilisez pour vous assurer qu'elles ne convertiront pas les facteurs en valeurs numériques.

+0

Je les convertis en facteurs déjà, je ne pense pas, votre réponse était jusqu'à la marque, et il devrait avoir un commentaire. – Shivam

+0

pourquoi n'est-il pas jusqu'à la marque? Votre question est clairement "Dois-je les convertir tous en facteurs?" – tpol

+0

Si vous n'aimez pas ma réponse, laissez-le être. Il semble que vous demandiez de l'aide et que vous vous attendiez à donner des réponses qui vous plaisent d'une manière ou d'une autre. – tpol