Nous travaillons actuellement sur une preuve de concept Apache Beam Pipeline sur Cloud Dataflow. Nous mettons des fichiers (pas de texte, un format binaire personnalisé) dans Google Cloud Buckets et nous aimerions lire ces fichiers comme byte [] et les désérialiser dans le flux. Cependant, nous ne pouvons pas trouver une source Beam capable de lire des fichiers non-texte. La seule idée est d'étendre la classe FileBasedSource
, mais nous pensons qu'il devrait y avoir une solution plus facile, car cela semble être une tâche plutôt simple.Comment lire les fichiers en tant que byte [] dans Apache Beam?
Merci les gars pour votre aide.