2017-07-12 3 views
1

J'ai un fichier qui utilise intensivement les trémas allemands. J'ai écrit un script pour traiter le fichier qui fonctionne comme il le devrait en natif (RStudio). Malheureusement, lors de l'utilisation de Renjin, tous les trémas sont définis sur des caractères inconnus dans les chaînes du fichier. En raison de la structure de fichier, j'utilise la commande readLines pour lire le fichier. La commande read.table() n'était pas une solution appropriée dans ce cas. Je veux utiliser Renjin depuis que je travaille dans une équipe Java et avec l'aide de Renjin je peux préserver notre environnement de travail, qui est bien sûr basé sur Java.Renjin ne reconnaît pas les trémas allemands

Java reconnaît correctement les trémas (utilise le codage de fichier correct). J'ai également vérifié si Renjin imprime correctement les trémas, ce qui n'est pas le cas. J'ai déjà essayé de définir les paramètres régionaux de R dans Renjin à "German_Germany.1252". Par conséquent, je la commande R suivante:

engine.eval("Sys.setlocale(category = 'LC_ALL', locale = 'German_Germany.1252')")

Le local est alors correctement réglé. Cependant, Renjin ne reconnaît pas du tout les trémas. Je l'ai vérifié en imprimant une ligne du fichier mais aussi avec un seul caractère directement passé à Renjin (en utilisant: engine.eval("print('äöß')")).

Avez-vous une idée pour résoudre ce problème? Si non, devrais-je ouvrir un problème sur github?

Répondre

1

Je suppose que c'est un problème avec Renjin en ce qui concerne les jeux de caractères non-Unicode. Par défaut, Renjin utilise Unicode partout, et UTF-8 pour lire et écrire dans les flux.

Si ce n'est pas possible, veuillez ouvrir un problème sur GitHub avec un petit fichier de test et un script.