J'ai lu environ Storm et jouer avec les exemples de storm-starter.Bon usage de la tempête?
Je crois que j'ai compris le concept et qu'il s'applique très bien à de nombreux cas. J'ai un projet de test que je veux faire pour en savoir plus, mais je me demande si Storm est vraiment adapté à cela.
Le problème conceptuel que j'ai est avec la définition 'streaming'. Il semble que Storms fonctionnera comme un charme qui s'abonne à un flux et le traite en temps réel, mais je n'ai pas vraiment de flux, mais plutôt une collection finie de données que je veux traiter.
Je sais qu'il y a hadoop pour cela, mais je suis intéressé par les capacités en temps réel de Storm ainsi que d'autres points intéressants que Nathan, qui a écrit Storm, mentionne dans ses entretiens.
Alors je me demandais, est-ce que les gens écrivent des becs qui interrogent les API non-streaming, puis diff les résultats pour émuler un flux?
Le deuxième point important est que les topologies Storm ne finissent jamais le traitement avant d'être interrompues, ce qui ne s'applique pas à mon cas. Je voudrais que ma topologie sache qu'une fois ma liste finie de données source terminée, le traitement peut se terminer et un résultat final peut être émis. Donc, est-ce que tout cela a du sens en termes de tempête ou est-ce que je regarde la mauvaise chose? Si oui, quelles alternatives proposez-vous pour ce type de besoins de calcul parallèle en temps réel?
Merci!