Je suis en train de résoudre l'erreur suivante (j'utilise la plate-forme databricks et étincelle 2,0)erreur Pyspark avec UDF: py4j.Py4JException: Méthode __getnewargs __ ([]) n'existe pas d'erreur
tweets_cleaned.createOrReplaceTempView("tweets_cleanedSQL")
def Occ(keyword):
occurences = spark.sql("SELECT * \
FROM tweets_cleanedSQL \
WHERE LOWER(text) LIKE '%" + keyword + "%' \
")
return occurences.count()
occurences_udf = udf(Occ)
Si je exécuter ce code, je reçois l'erreur suivante:
py4j.Py4JException: Méthode getnewargs ([]) n'existe pas ==> erreur se produit uniquement lorsque vous essayez de définir la udf.
merci beaucoup –