Je souhaite enregistrer du texte dans la base de données à l'aide des wrappers ORM de Django. Le problème est, ce texte est généré en grattant des sites Web externes et plusieurs fois il semble qu'ils sont répertoriés avec le mauvais encodage. Je voudrais stocker les octets bruts afin que je puisse améliorer ma détection d'encodage au fil du temps sans refaire les éraflures. Mais Django semble vouloir que tout soit stocké comme unicode. Puis-je contourner cela en quelque sorte?Comment gérer unicode d'un encodage inconnu dans Django?
1
A
Répondre
1
Vous pouvez stocker des données, codées en base64, par exemple. Ou essayez d'analyser les en-têtes HTTP à partir du navigateur, peut-être qu'il est plus simple d'obtenir un encodage approprié à partir de là.
1
Créer un fichier avec les données. Utilisez un Django models.FileField
pour conserver une référence au fichier.
Non, cela n'implique pas une tonne d'E/S. Si votre fichier est petit, il ajoute 2 ou 3 E/S (le répertoire lu, l'iNode lu et les données lues).
Questions connexes
- 1. IronPython "LookupError: encodage inconnu: hex"
- 2. Unicode Encodage et décodage problèmes dans QRCode
- 3. Unicode appnames dans Django
- 4. Windows Service Encodage non-Unicode Problème
- 5. Py3K RC-1: "LookupError: encodage inconnu: UFT-8"
- 6. meilleure façon de gérer JSON dans django
- 7. Comment gérer une relation plusieurs à un dans Django
- 8. Unicode dans PostScript
- 9. Unicode problème Django-Python-URLLIB-MySQL
- 10. élément inconnu dans JQuery cliquez
- 11. Encodage UTF en Java
- 12. comment gérer un événement sur un événement Django Calendrier
- 13. Encodage Problème de conversion
- 14. XHTML et & (esperluette) encodage
- 15. Meilleure façon de gérer les variables de requête dans Django
- 16. WM_CHAR non-unicode dans les fenêtres unicode
- 17. libsox encodage
- 18. état à la compilation inconnu
- 19. Unicode dans vb.net
- 20. Encodage montant dans le paiement paypal
- 21. Encodage dans Streamreader dans mon application Silverlight
- 22. encodage url esperluette émet
- 23. Asp.net: encodage de chemin
- 24. Comment entrer des caractères Unicode dans Eclipse?
- 25. Communication Unicode et réseau
- 26. Encodage de huffman
- 27. Comment gérer des données erronées?
- 28. Encodage des caractères spéciaux
- 29. NSLog incorrect encodage
- 30. Unicode dans NetBeans 6.7.1
Certains pourcentages de sites utilisent un encodage incohérent sur la page. Je veux toujours stocker les données brutes afin que je puisse revenir en arrière et voir exactement. – lacker