Nous utilisons Spark structuré en streaming avec le paquet étincelle-eventhubs pour lire les messages de l'Azure IoTHub. Dans certaines situations, le point de contrôle Spark ne fonctionne pas comme nous le voulons. Par conséquent, nous aimerions pouvoir définir les décalages de départ manuellement.Impossible de définir le décalage de début éclateurs eventhubs
Notre plan était d'attribuer les décalages manuellement dans la carte Paramètres IoThub, par deux réglages:
- "eventhubs.filter.offset" -> { "partitionKey1": "Offset1", ...} ou
- "eventhubs.startingOffsets" -> { "partitionKey1": "Offset1", ...}
les deux versions ne fonctionne pas, ce qui signifie que Spark commence toujours la lecture du premier message de données obtenu à partir de la IoTHub.
Nous ne savons pas non plus si la syntaxe ci-dessus est correcte, car il n'y a pas de documentation à ce sujet.
Nous utilisons Spark 2.1 et le paquet étincelle-eventhubs de Maven:
"com.microsoft.azure" % "étincelle streaming eventhubs_2.11" % "2.1.1"