J'ai créé un fichier DataFrame à partir d'un fichier XML. Le DataFrame créé a le schéma ci-dessous.Champ de masque de colonne (type struct) dans Saprk DataFrame
val df = hiveContext.read.format("com.databricks.spark.xml").option("rowTag", row_tag_name).load(data_dir_path_xml)
df.printSchema()
root
|-- samples: struct (nullable = true)
| |-- sample: array (nullable = true)
| | |-- element: struct (containsNull = true)
| | | |-- abc: string (nullable = true)
| | | |-- def: long (nullable = true)
| | | |-- type: string (nullable = true)
|-- abc: string (nullable = true)
Je voudrais masquer l'abc/def dans la trame de données.
j'ai pu aller sur le terrain que je veux à l'aide:
val abc = df.select($"samples.sample".getField("abc"))
Mais je veux masquer le champ abc/def (remplacer champ abc avec XXXX) dans la trame de données df. S'il vous plaît aidez-moi sur ce
qu'entendez-vous par masque abc/def? Est-ce que vous voulez masquer abc avec la valeur def? –
Je souhaite remplacer les champs 'abc' et 'def' par une valeur 'xxxxx'. Ces champs sont des données sensibles. – Raj
vous voulez remplacer les valeurs de colonne à droite? –