2010-09-07 5 views
3

GOAL Mon objectif est de trouver un fichier texte ou une bibliothèque qui me permet de mapper une entrée de type mime et de retourner un format convivial.Bibliothèque Java ou fichier texte qui mappe les types mime aux gentils types de fichiers conviviaux

Par exemple, étant donné le type mime pour Word (comme indiqué ci-dessous), je voudrais un résultat qui ressemble à "Microsoft Office Word Document".

application/vnd.openxmlformats-officedocument.wordprocessingml.document 

Je me rends compte que je pouvais compiler ma propre liste et utiliser quelque chose comme une carte (Java), mais il ne serait pas complète, etc.

OPTION Je sais Simplistic je peux examiner et retourner le sous mime tapez et gardez le dernier composant, mais ce n'est pas très sophistiqué selon le type Word MIME ci-dessus le résultat serait un «document» très générique. Je pourrais développer et prendre plus de composants mais le résultat est encore assez moche.

KEY/VALUE FILE Une autre option que j'ai essayé de trouver est un fichier texte avec des paires clé/valeur où la clé est le type mime en entier et la valeur étant le gentil texte convivial. Cela semble être une bonne option, mais je n'ai pas réussi à trouver un fichier texte définitif avec beaucoup d'entrées. Ce serait aussi bien si une source pour juste le média (je préfère l'appeler le type mime primaire) le "texte" dans "text/plain" était présent donc un type mime de texte inconnu tel que "text/unknown abc" return "Fichier texte/format inconnu".

+0

nouveau, plus de balises peuvent vous aider à avoir plus de réponses ..;) –

Répondre

1
+0

Les liens dottoro et pdx-edu sont assez bonnes mais peu compréhensibles ... une chance d'avoir un lien plus complet? Je ne suis pas intéressé par les listes qui ne donnent que mime type = extensions de fichier ... –

2

Apache Tika supporte MimeTypes. Par ailleurs, il prend également en charge Content Detection si vous ne connaissez pas le type mime. Quoi qu'il en soit, il semble que vous devez faire:

String t = "text/plain"; 
org.apache.tika.mime.MimeTypes.getMimeType(t).getDescription(); 

Disclaimer: Je n'ai pas essayé réellement. En outre, je ne sais pas si elle supporte tous les types de mime dont vous avez besoin.

+1

Merci d'avoir remarqué cela. A l'intérieur de tika-core.jar il y a un fichier xml tika-mimetypes.xml qui contient beaucoup de types mime et de descriptions. On dirait que ça devrait marcher ... merci encore! –

+0

La plupart des entrées dans le xml sont ignorées car pour certaines raisons tika est en train de définir des descriptions à partir de balises appelées "_comment" mais pas de "description", etc .. Voulant classer un problème/patch .. –

+0

cela semble être corrigé depuis la version 0 .8 (https://issues.apache.org/jira/browse/TIKA-515) –

Questions connexes