Il peut être utile de décrire davantage votre scénario. Puisque vous essayez de trouver des événements rares, je suppose que vous avez une définition de travail pas rare (pour certains espaces problème c'est vraiment difficile). Par exemple, disons que nous avons un processus qui n'est pas un processus de marche aléatoire comme l'utilisation du processeur pour certains services. Si vous voulez détecter des événements rares, vous pouvez prendre l'utilisation moyenne et ensuite voir plusieurs écarts-types. Les techniques de Statistical Process Control sont utiles ici.
Si nous avons un processus de marche aléatoire tel que le cours des actions (boîte de vers ouverte ... veuillez supposer cela par souci de simplicité). Le mouvement directionnel de t à t + 1 est aléatoire. Un événement aléatoire peut être un certain nombre de mouvements consécutifs dans une seule direction ou un grand mouvement dans une seule direction à un seul pas de temps. Voir Stochastic Calculus pour les concepts sous-jacents.
Si un processus à l'étape t dépend uniquement de l'étape t-1, nous pouvons utiliser Markov Chains pour modéliser le processus.
Voici une courte liste de techniques mathématiques à votre disposition. Maintenant sur l'apprentissage automatique. Pourquoi voulez-vous utiliser l'apprentissage automatique? (Toujours bon à penser pour vous assurer de ne pas trop compliquer le problème) Supposons que vous faites et c'est la bonne solution. L'algorithme que vous utilisez n'est pas très important à ce stade. Ce que vous devez faire est de définir ce qu'est un événement rare. Inversement, vous pouvez définir ce qu'est un événement normal et rechercher des choses qui ne sont pas normales. Notez que ce ne sont pas la même chose. Disons que nous produisons un ensemble d'événements rares r1 ... rn. Chacun de ces événements rares aura certaines fonctionnalités associées. Par exemple, si un ordinateur a échoué, il pourrait y avoir des fonctionnalités comme la dernière fois qu'il a été vu sur un réseau, son statut de port de commutateur, etc ... C'est en fait la partie la plus importante de l'apprentissage machine. Il consiste généralement à étiqueter manuellement un ensemble d'exemples pour former le modèle. Une fois que vous avez une meilleure compréhension de l'espace des caractéristiques, vous pourrez peut-être former un autre modèle à étiqueter pour vous. Répétez ce processus jusqu'à ce que vous soyez satisfait. Maintenant, si vous êtes en mesure de définir votre ensemble d'événements rares, il peut être moins coûteux de générer simplement des heuristiques. Pour détecter des événements rares, j'ai toujours trouvé que cela fonctionne mieux.
Cela dépend de ce que vous voulez dire quand vous parlez d '«événement rare» ... comment la rareté d'un événement est-elle quantifiée dans le domaine de votre problème? – Kiril
Regardez le processus du point marqué pour savoir comment les incréments informatifs peuvent être traités. – Tristan
Une fois en quelques jours, mais les données sont des données minute. Donc, ses quelques 120 minutes en (2-10) * 1440 mins – AlgoMan