2010-07-29 8 views
1

Est-ce que quelqu'un connaît un moyen rapide et facile de localiser les caractères spéciaux qui n'ont pas été correctement convertis lors de l'importation des données dans MySQL.Recherche de caractères spéciaux dans la base de données MySQL

Je pense que c'est un problème dû au codage de données (par exemple Latin-1 par rapport à UTF-8). Quel que soit l'endroit où le problème est survenu pour la première fois, je suis coincé avec des données indésirables que je dois supprimer.

+0

Comment avez-vous * importé * les données dans MySQL? – pascal

Répondre

0

Il n'y a probablement pas de fonction facile pour cela, car par exemple, un caractère spécial UTF-8 cassé sera composé de deux caractères ISO-8859-1 valides. Donc, bien qu'il y ait des modèles de ce à quoi ces personnages brisés ressemblent, il n'y a pas de façon infaillible de les identifier.

Vous pouvez créer une fonction de recherche + remplacement pour remplacer les occurrences les plus courantes dans votre langue (par exemple Ãœ pour Ü si importé de UTF-8 dans ISO-8859-1). Cela dit, il serait préférable de redémarrer l'importation avec les paramètres corrects, si possible.

+0

Malheureusement, réimporter les données à ce stade n'est pas vraiment une option. Et il n'y a pas beaucoup de ces caractères spéciaux saupoudrés dans les données. Mais même en écrivant un script search-n-replace, vous devez avoir une liste de début de caractères spéciaux à remplacer. C'est la liste que j'essaie de créer. – gurun8

Questions connexes