J'ai une table de base de données appelée "tweets". J'ai téléchargé des tweets en utilisant l'API de recherche Twitter. Le classement de la table de base de données est défini sur latin1_swedish_ci, comme conseillé par MySQL, car il supporte au moins le langage Enlish (je l'ai lu quelque part sur les pages de support de MySQL).Texte brouillé dans la base de données MySQL
Quoi qu'il en soit, je vois maintenant beaucoup de tweets qui ressemble à ceci:
$S&P news: Bank of America’s Mortgage-Bond Accord http://bit.ly/oTXC5a
@LucciAlerts >> $BAC from a pincher play setup
미êµì‹ 용등급ì´ë–¨ì–´ì¡Œë„¤ RT @CNBC RT @alexcrippen: S&P affirms AA+
- Je crois & et les goûts peuvent être fixés en utilisant pour les traduire en caractères originaux (PHP) htmlspecialchars_decode();
- Mais je ne sais pas comment réparer "America's", par exemple. Évidemment, ça devrait être un apostophe ('), mais comment puis-je le récupérer?
- Enfin, il y a des gens qui aiment mettre toutes sortes de caractères ASCII dans leurs tweets (les étoiles, les "vrais" smileys au lieu des émoticônes). Ceux-ci ont été stockés comme "믯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯s, comme ci-dessus. Y at-il un moyen de résoudre ce problème et si oui, comment?
Toute aide est grandement appréciée!
recommande un interrupteur rapide de latin1_swedish_ci UTF8 –
Définir vos charset 'utf8' et essayez à nouveau. – Leigh
Voir, par exemple, https://api.twitter.com/1/statuses/show.json?id=38041113268854784. Le contenu du texte Tweet ("texte") donné par l'API est: « $ \ u00aa \ u00aa \ u264f \ u00aa \ u00aa^$ \ u00aa \ u00aa \ u264f \ u00aa \ u00aa RT nadiaberod: makasih (\ u007B \ u007D) RT Lsa_fabulous: ThRT nadiaberod: anind_aurelly Lsa_fabulous dénycientes @nuruuuuuuuul ?? ". Comment alors, obtenez-vous les caractères originaux? En passant par utf8_decode() doesn; t aider ... – Pr0no