J'essaie d'utiliser TraMineR mais je suis ouvert aux commentaires/références/liens pour plus d'informations sur la façon de représenter les séquences d'événements multicanaux ou hiérarchiques et les algorithmes qui y sont associés.comment représenter les séquences d'événements multicanaux
J'ai une structure complexe d'événements que j'essaie de comprendre comment représenter une séquence. Il existe différents types d'événements. Chaque type d'événement peut avoir un ensemble différent de champs (et différents nombres de champs). Par exemple, l'âge peut être un champ dans un type d'événement alors que la hauteur peut être un champ dans un autre type d'événement. Mon premier instinct (et je crois qu'une approche commune) consistait à "aplatir" tout, par ex. chaque combinaison possible de valeurs pour un événement constitue un type d'événement unique. Cependant, cela peut manquer des modèles dans les types d'événements génériques. Par exemple, disons que je suis un éleveur de chiens et que je bois beaucoup de café et que je veux voir s'il y a des habitudes dans mes habitudes d'achat de café/chien (oui, un exemple stupide). Je pourrais avoir des événements comme:
- Bought dog
- Breed: hound
- Sex: female
- Bought coffee
- Store: Starbucks
- Roast: dark
- Bought dog
- Breed: hound
- Sex: female
- Bought coffee
- Store: Starbucks
- Roast: light
- Bought dog
- Breed: Doberman pincher
- Sex: male
Pour aplatir les données que je peux dire que chaque combinaison unique de magasin et rôti est un événement d'achat de café unique. En outre, chaque combinaison unique de race et de sexe est un événement d'achat de chien unique. Cette approche transformerait l'exemple ci-dessus en 5 types d'événements différents (plutôt que 2 types d'événements avec champs). Cette représentation pourrait détecter des tendances telles que les suivantes: si je bois 2 cafés torréfiés noirs de Starbucks, alors je suis plus susceptible de le faire avec un pigeon doberman mâle. Toutefois, cette représentation peut manquer des motifs plus généraux qui ne dépendent pas des valeurs de champ dans les événements. Par exemple, il se peut que j'achète simplement un chien après avoir deux cafés en général. Je voudrais être capable de détecter des modèles aux deux "niveaux" et ne suis pas sûr de la façon de représenter les événements pour le faire. Bien sûr, une approche serait d'utiliser les deux représentations, puis de combiner les résultats des deux.
Donc, les questions sont: 1. Tous les liens/citations à des articles qui traitent de cela? 2. Est-ce un problème commun? 3. Des recommandations sur la façon de représenter ces événements? 4. Des recommandations sur la façon de travailler avec eux dans TraMineR 5. Des recommandations/liens/références à des algorithmes qui traitent de ce genre de chose? 6. Des idées du tout?
Merci !!!
Quelqu'un a-t-il déjà traité ce problème auparavant? Est-ce complètement unique? Je trouve cela difficile à croire mais je n'ai rien. – jojo