2009-04-27 7 views
1

Je suis nouveau à faire n'importe quoi avec n'importe quelle langue qui n'est pas l'anglais. Jusqu'à présent, le seul que j'ai jamais fait avec la programmation est de prendre des entrées dans les lettres anglaises + chiffres et de le sortir. Maintenant, je dois manipuler du texte en russe (surtout sur la page wikipédia russe) mais je n'ai aucune idée par où commencer. Je google et google mais tout ce que je reçois sont des résultats qui parlent d'unicode, UTF-8 et d'autres choses, mais ceux-ci n'ont pas de sens pour moi parce que je ne suis pas sûr de ce à quoi ils se réfèrent. Les entrées Wikipédia elles-mêmes semblent être écrites pour les personnes qui connaissent déjà ce genre de choses.Comment puis-je gérer du texte russe en Perl?

Quelqu'un peut-il me diriger vers un bon point de départ?

Répondre

7

Il semble que vous devriez d'abord avoir une idée de ce qu'est Unicode. L'article de Joel Spolsky The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!) pourrait être un bon point de départ (pour les personnes expérimentées, il est assez peu informatif, cependant). Après cela, vous devriez regarder comment Perl gère Unicode, comme jeter un oeil à la Perl Unicode Tutorial.

+0

Merci. Je pense que cet article est ce que je cherchais :) – Mike

+0

Note: En fait, l'article de Joel est assez horrible d'un point de vue technique et simplifie beaucoup de choses qui ne devraient probablement pas l'être. Je ne prétends pas que je pourrais en écrire un meilleur, mais j'ai déjà prouvé à maintes reprises que la demi-connaissance fait réellement mal et que vous n'en aurez probablement pas beaucoup plus après avoir lu cet article. – Joey

Questions connexes