2017-05-14 4 views
0

Nous recueillons des données sur le trafic de notre site Web, ce qui se traduit par environ 50k à 100k visites uniques par jour.Analyse de cohorte de druide?

Analyse de cohorte:

Trouver le pourcentage d'utilisateurs dans un délai de 24 heures qui enregistrent sur le site Web puis aller en fait à notre page d'achat (calculer les pourcentages du nombre d'utilisateurs le faire dans le premier , deuxième, troisième etc. heure après l'enregistrement).

Deux exemples de documents très abrégés:

  • sessionId: notre identifiant unique pour effectuer compte
  • url: l'URL pour les cohortes d'évaluation
  • temps: horodatage unix pour l'événement

{ "ID session": "ID aléatoire", "heure": 1428238800000, (horodatage unix: 5 avril, 15h00) " url ": "/ registre" }

{ "sessionId": "some-random-id", "temps": 1428241500000, (timestamp unix: 5 avril, 15h45) "url" : «/acheter » }

Si je veux faire la même agrégation pour une période de, disons, 6 mois & aimeraient vérifier effectuer des cohortes pour le retour des clients? L'ensemble de données serait trop vaste. Sur une note de côté: Je ne suis pas non plus intéressé à obtenir des résultats 100% précis, une approximation serait suffisante pour l'analyse des tendances.

Pouvons-nous y parvenir avec Druide? Ou ce n'est pas adapté à ce type d'analyse? Y a-t-il autre chose qui soit supérieur à l'analyse de cohorte?

Répondre

0

Je pense que vous pouvez le faire avec des croquis et des Druides données. Regardez le dernier exemple est ce page Si vous voulez aller avec cette méthode d'approximation, vous pouvez regarder here pour comprendre les erreurs liées de l'approximation et le compromis que vous pouvez faire pour échanger la mémoire pour la précision.

+0

Merci d'avoir choisi les croquis de données. –