J'ai commencé à travailler avec R en arabe, car je prévois de faire de l'analyse de texte et de l'exploration de texte avec le corpus Hadith. J'ai lu des discussions liées à ma question, mais néanmoins, je n'arrive toujours pas à obtenir les bases REAL ici (désolé, débutant absolu).Le texte arabe ne s'affiche pas dans R-
Alors, je suis entré dans: textarabic.v < - scan ("data/arabe-text.txt", encoding = "UTF-8", ce qui = "caractère", sep = "\ n")
Et ce qui sort textarabic.v
est bien sûr, des symboles (pic). Avant cela, j'ai sauvé mon texte dans utf-8 car j'ai lu dans un fil mais toujours rien ne montre en arabe.
Je peux taper en arabe R mais le balayage met le texte en symboles.
également lu et essayé de mettre en œuvre d'autres codes de l'utilisateur sont à faire fonction de texte arabe, mais je ne sais même pas comment et où les mettre en œuvre. J'ai ajouté aux packages R, tm et NLP.
Que me suggérez-vous de faire ensuite? Merci d'avance,
Bienvenue dans Stack Overflow! S'il vous plaît lire les informations sur [comment poser une bonne question] (http://stackoverflow.com/help/how-to-ask) et comment donner un [exemple reproductible] (http://stackoverflow.com/questions/ 5963269). Cela rendra beaucoup plus facile pour les autres de vous aider. – zx8754
Puis-je supposer que vous êtes sur Windows? Si c'est le cas, j'ai eu une expérience terrible avec les encodages. Cependant, les systèmes d'exploitation -six semblent bien gérer (UTF8). –
J'utilise OS X pour le moment. – Esc6