2011-08-06 5 views
9

J'ai un document Excel avec une table de données contenant des caractères chinois. J'essaie d'exporter cette feuille de calcul Excel dans un fichier CSV pour l'importer dans une base de données MySQL.Comment exporter un fichier Excel avec des caractères chinois vers un fichier CSV?

Toutefois, lorsque je sauvegarde le document Excel en tant que fichier CSV, Bloc-notes affiche les caractères chinois du fichier CSV résultant comme points d'interrogation. L'importation dans MySQL préserve les points d'interrogation, ignorant complètement les caractères chinois d'origine.

Je soupçonne que cela peut être lié à l'utilisation d'Excel avec un codage UTF-8. Merci de votre aide!

+0

Le bloc-notes est factice. Avez-vous essayé de l'ouvrir avec un vrai éditeur de texte? tel que notepad ++ ou ultraeditor. –

+0

Merci Huang. J'ai essayé Notepad ++ et puis jEdit, qui tous deux supportent UTF-8. Les points d'interrogation ne se transforment toujours pas en caractères chinois. Ainsi, je pense qu'Excel gargarise simplement les caractères chinois quand il importe la feuille de calcul au format CSV. Je suis toujours à la recherche d'une solution à ce problème. – user534017

Répondre

2

Vous pourriez vouloir essayer notepad ++, je doute que le bloc-notes supportera les caractères Unicode.

http://notepad-plus-plus.org/

+0

Notepad prend en charge les caractères Unicode si le fichier commence par quelque chose reconnu comme une marque d'ordre des octets, ce qui est vraiment moche en UTF-8 (d'autant plus que UTF-8 n'en a pas besoin). –

+0

Salut, par dessus, j'ai essayé Notepad ++ et jEdit, qui tous deux supportent UTF-8. Encore une fois, les points d'interrogation ne se transforment toujours pas en caractères chinois. Ainsi, je pense qu'Excel gargarise simplement les caractères chinois quand il importe la feuille de calcul au format CSV. Je suis toujours à la recherche d'une solution à ce problème. – user534017

+0

Excel n'exporte pas au format CSV en UTF-8. Il prend uniquement en charge UTF-8 au format "Unicode Text". – Nelson

8

Pour autant que je sais Excel ne sauvegarde pas les fichiers CSV dans un codage Unicode. J'ai récemment eu des problèmes similaires en essayant d'exporter un fichier CSV avec le symbole £. J'ai eu l'avantage de pouvoir utiliser un autre outil.

Ma version d'Excel 2010 peut exporter au format Unicode File > Save As > Unicode Text (.txt), mais la sortie est un fichier codé délimité par des tabulations et codé UCS-2. Je ne connais pas du tout MySQL, mais un bref aperçu des spécifications et il semble gérer les importations délimitées par des tabulations et UCS-2. Cela peut valoir la peine d'essayer cette sortie.

Edit: De plus, vous pouvez toujours ouvrir cette sortie Unicode dans Notepad ++ convertir en UTF-8 Encoding > Convert to UTF-8 without BOM et remplacer éventuellement tous les caractères de l'onglet avec des virgules trop (Utilisez Remplacer le dialogue en mode Extended Search, \t dans la zone Rechercher et , . dans la zone Remplacer)

7

la méthode suivante a été testé et utilisé pour importer des fichiers CSV dans MongoDB, il devrait fonctionner:

  1. dans votre feuille de calcul Excel, allez dans fichier> Enregistrer sous.

  2. Nommez le fichier et choisissez Texte Unicode (* .txt) dans la liste déroulante à côté de "Enregistrer en tant que type", puis cliquez sur Enregistrer.

  3. Ouvrez le fichier .ict unicode à l'aide de votre éditeur de texte préféré, par exemple le Bloc-notes. Comme notre fichier texte Unicode est un fichier délimité par des tabulations et que nous voulons convertir Excel en fichier CSV (séparé par des virgules), nous devons remplacer tous les onglets par des virgules.

  4. Sélectionnez un caractère de tabulation, faites un clic droit dessus et choisissez Copier dans le menu contextuel, ou appuyez simplement sur CTRL + C comme illustré dans la capture d'écran ci-dessous.

  5. Appuyez sur CTRL + H pour ouvrir la boîte de dialogue Remplacer et collez l'onglet copié (CTRL + V) dans le champ Rechercher. Lorsque vous faites cela, le curseur se déplacera vers la droite indiquant que l'onglet a été collé. Tapez une virgule dans le champ Remplacer par, puis cliquez sur Remplacer tout.

  6. Cliquez sur Fichier> Enregistrer sous, entrez un nom de fichier et modifiez le codage en UTF-8. Puis cliquez sur le bouton Enregistrer.

  7. Modifier l'extension txt à .csv directement dans Save Bloc-notes comme boîte de dialogue et sélectionnez Tous les fichiers (.) à côté de Enregistrer sous, comme le montre la capture d'écran ci-dessous.

  8. Ouvrez le fichier CSV à partir d'Excel en cliquant sur Fichier> Ouvrir> Fichiers texte (.prn, .txt, .csv) et vérifiez que les données sont correctes.

Source here

0

J'ai essayé toutes les méthodes ci-dessus pour mes données, mais il ne fonctionne pas tout à fait pour mes données (chinois simplifié, plus 700Mo. J'ai essayé Windows chinois et le système anglais, anglais et chinois excel Windows excel ne semble pas pouvoir sauvegarder en utf8 même s'il prétend le faire.J'ai spécifié le csv d'uft8 dans save as, mais quand j'utilise la 'feuille ouverte' pour détecter les méthodes d'encodage, ce n'est pas uft8, pas GB * Voici ma solution finale:

(1) Téléchargez 'feuille ouverte'.

(2) Ouvrez-le correctement. Vous pouvez faire défiler la méthode d'encodage jusqu'à ce que vous voyiez le caractère chinois affiché dans les fenêtres d'aperçu.

(3) Enregistrez-le en utf-8 (si vous voulez utf-8). PS: Vous devez déterminer l'encodage par défaut dans votre système. En ce qui concerne comme je sais, Ubuntu traite UTF8 bien. Mais les fenêtres par défaut Chinois simplifié commence par GB **. Même si vous l'encodez en utf8, , vous pouvez également l'ouvrir de manière concordante. Dans mon cas, r ne pouvait pas ouvrir mon utf-8 csv, mais peut ouvrir l'encodage GB *.

Cette méthode fonctionne bien même si votre fichier est très volumineux. Un autre travail est la feuille de google (mais la taille du fichier peut être limitée). Notepad ++ fonctionne également pour les fichiers plus petits.

Il existe un moyen de détecter les méthodes de codage en ouvrant votre fichier et en faisant défiler les méthodes de codage jusqu'à ce que le chinois s'affiche correctement.

Questions connexes