2017-06-01 1 views
0

Ceci est mon premier projet ANN et j'essaie de comprendre si je gère correctement la normalisation des données.est-il correct d'utiliser des plages mixtes dans les attributs NN? certains [0,1] et certains [-1,1]

Je les types d'attributs * Binary * Numérique (qui peut être négatif et positif) * Numérique (qui ne peut être que positif)

  1. Est-il exact que certains des attributs suivants seront propagation sur la plage de [-1, 1] et certains sur la plage de [0, 1]
  2. Existe-t-il un moyen de convertir les données positives pour étaler sur la plage de [-1,1]?
  3. Dose qui a du sens?

Répondre

1
  1. Il est pas nécessairement « mauvais », aussi longtemps que vous le faites régulièrement. Cependant, vous devez rechercher quelles valeurs vos réseaux de neurones prennent - si votre réseau accepte [-1, 1] comme entrée, il est conseillé d'utiliser toute cette plage. Y a-t-il une raison pour laquelle vous voulez utiliser différentes gammes?

  2. Bien sûr, il y a! Check out this answer

  3. Un réseau de neurones n'a pas besoin de savoir si un nombre était positif ou négatif avant la normalisation. Tant que vous normaliser chaque entrée de manière cohérente, cela ne posera pas de problème.


Modifier après votre commentaire:

Vous devriez vraiment savoir si votre bibliothèque de réseau de neurones accepte[-1, 1] en premier lieu.

Si tel est le:

  • Conserver les distances dans la gamme [0,1]
  • Gardez nombre normal (négatif) dans la gamme [-1,1]

S'il ne marche pas:

  • Conserver distances ET toutes les autres valeurs dans la plage [0,1]

Voilà comment je le ferais. Cependant, vous pouvez tester vous-même ce qui fonctionne le mieux par essais et erreurs.

+0

Certaines des données (numériques, positives et négatives) représentent la position, donc le delta représentant la distance peut être positif et négatif. et certains sont la distance d'édition entre les chaînes, de sorte qu'il ne peut être que positif. Est-il juste d'utiliser la fonction min/max pour cela? –

+0

@AdiDarachi Je vois ce que tu veux dire maintenant. Je vais modifier ma réponse. –

+0

1. J'utilise Tanh comme fonction d'activation, donc le réseau peut recevoir [-1, 1] gamme (dose qui fait sens?). 2. vaut-il mieux garder la plage 0-1 plutôt que -1 à 1 quand -1 est pire et 1 vaut mieux? Merci est avancé –