0

J'ai une question sur une approche d'une solution dans Azure. La question est de savoir comment choisir les technologies à utiliser et comment trouver la meilleure combinaison.Azure POS et stratégie d'analyse des données météorologiques

Supposons que j'ai deux ensembles de données, qui augmente chaque jour:

  1. J'ai un fichier CSV qui vient tous les jours à mon magasin d'ADL et il contient des données météorologiques pour tous Lattitudes et combinaisons possibles Longtitudes et zip codes pour eux, avec 50 variables météorologiques différentes. J'ai un autre ensemble de données avec POS (point de vente), qui vient également en tant que fichier CSV quotidien à mon stockage ADL. Il contient des données sur les ventes pour tous les points de vente au détail.

La sortie désirée est d'avoir les fichiers « déchiquetés » d'une manière que les données sont préparées pour la prévision AzureML des ventes en fonction de la météo et les prévisions se fait par emplacement au détail et livré via le tableau de bord PowerBI à chaque l'un d'eux. Une exigence est de ne pas autoriser les emplacements différents à voir les prévisions pour d'autres emplacements.

Mes questions sont les suivantes:

  1. Comment puis-je choisir le bon ensemble de technologies?
  2. Comment ajouter les données quotidiennes entrantes?
  3. Comment puis-je créer des résultats de prévision ML distincts pour chaque emplacement?

Tout conseil général sur le sujet de l'architecture est apprécié, et des idées plus spécifiques sur la comparaison de différentes solutions appropriées sont également appréciées.

+0

Ceci est un sujet de discussion très large, qui sollicite l'opinion. Aussi une question de recommandation d'outil (comme vous cherchez la comparaison de différentes solutions/technologies). Malheureusement, hors sujet pour StackOverflow. –

Répondre

0

Ceci est une manière d'élargir une question.

Je ne répondre à votre question spécifique ADL # 2 et vous donner un indice sur # 3 qui ne sont pas liés à Azure ML (puisque je ne sais pas ce que le format est):

  1. Si vous utilisez simplement des fichiers, ajoutez des informations de date/heure au nom de votre chemin de fichier (dans le dossier ou le nom de fichier). Utilisez ensuite les ensembles de fichiers U-SQL pour interroger les plages qui vous intéressent. Si vous utilisez des tables U-SQL, utilisez PARTITIONED BY. Pour plus de détails, regardez dans le U-SQL Reference documentation.

  2. Si vous devez créer plusieurs fichiers en sortie, vous avez deux options:

    a. vous connaissez tous les noms de fichiers, écrivez une instruction OUTPUT pour chaque fichier en ne sélectionnant que les données pertinentes.

    b. vous devez générer dynamiquement un script puis l'exécuter. Similaire à this.