2012-02-17 4 views
1

J'ai un logiciel de clustering où le modèle est une chaîne de caractères. Les chaînes sont regroupées par similarité en utilisant la plus longue sous-séquence commune. Il est possible de faire un tracé 2d de ces grappes ?? Comment puis-je représenter une chaîne sur l'axe xy?représente une chaîne dans un tracé 2D

La seule idée que j'est d'utiliser le code ascii afin d'avoir un nombre entier de chaîne, par exemple: rouge = 315 becouse r = 114 e = 101 d = 100

mais il est 1D représentation !!

p.s. le logiciel est Java, mais pour les données de tracé, j'utilise habituellement Matlab

Répondre

2

Il existe une infinité de façons de convertir une chaîne en un nombre. Essentiellement, c'est juste une séquence d'octets, donc ils sont déjà des nombres.

La question est, que voulez-vous voir? La plupart de ces "conversions" seront partout et ne donneront pas vraiment de sens.

Deux techniques qui me viennent à l'esprit sont les cartes auto-organisées et la mise à l'échelle multidimensionnelle. Vous pouvez probablement alimenter les données de similarité dans la méthode, et lui faire organiser les objets dans une carte 2D pour vous.

Cela marchera probablement et semblera, joli, mais ne répond pas vraiment à la question "qu'est-ce que vous voulez accomplir".

+0

Si c'est possible je veux voir le point dans un tracé 2D, par exemple: le point qui représente le mot "induction" peut être proche du mot "intrusion". La question est de savoir comment représenter "induction" dans un espace 2D? – tulkas85

+0

Jetez un oeil aux pointeurs ci-dessus, tels que MDS. Il est destiné à préserver les distances, et vous pouvez l'initialiser avec la distance de Levenshtein. –

Questions connexes