J'ai téléchargé un fichier .LIST à partir de la base de données imdb, et je veux les utiliser pour certaines analyses de réseaux sociaux (recherche avec des références), en utilisant un logiciel SNA (où l'entrée peut être en xml ou csv) ...créer un fichier XML à partir du format de fichier LIST
0
A
Répondre
1
0
Voilà quelque chose de pertinent, je cuisinais jusqu'à: Un fichier sed « movies2xml.sed »:
# ampersand etc ..
s|&|\&|g
s|<|\<|g
s|>|\>|g
# last field, if range
s|\([12\?][0189\?][0-9\?][0-9\?]\)-\([12\?][0189\?][0-9\?][0-9\?]\)$|<when><f>\1</f><t>\2</t></when>|
# last field, if single
s|\([12?][0189?][0-9?][0-9?]\)$|<when><y>\1</y></when>|
# made-for tv/vid/vidgame ..
s|(\([TVG][TVG]*\)) *<when|<for>\1</for><when|
# episode
s|{\(.*\)} *|<ep>\1</ep>|
# ep season, number
s|<ep>\(.*\)(#\([0-9][0-9]*\)\.\([0-9][0-9]*\))</ep>|<ep s='\2' e='\3'>\1</ep>|
# release year/Number (when titles are duplicated in a year)
s| (\([12\?][0189\?][0-9\?][0-9\?]\)\/*\([IVX]*\)) <|<y N='\2'>\1</y><|
s|<y N=''>|<y>|
# TV titles
s|^"\([^<]*\)"<y|<title type='tvseries'>\1</title><y|
# titles
s|^\(.[^<]*\)<y|<title type='film'>\1</title><y|
# vid game
s| type='film'\(.*<for>VG<\)| type='videogame'\1|
# wrap tag
s|^\(<.*>\)$|<entry>\1</entry>|
# rm other text
s|^\([^<].*\)$|<!-- \1 -->|
Les tagnames xml sont un peu laconique, mais (en juin '14) il y a 2,936,679 entrées, ce qui rend jusqu'à 334MB ..
I traiter le fichier zip-imdb comme ceci:
(F=movies.xml ; echo '<list>' > $F ; \
zcat movies.list.gz | \
tr '\t' ' ' | tr -s ' -' | recode l9..u8..xml | \
sed -f movies2xml.sed >> $F ; \
echo '</list>' >> $F ;) &
cette sortie xml valide alors avec ce XSD:
<?xml version="1.0" encoding="UTF-8"?>
<!-- imdb_movies_list.xsd -->
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="list">
<xs:complexType>
<xs:sequence>
<xs:element minOccurs="0" maxOccurs="unbounded" ref="entry"/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element name="entry">
<xs:complexType>
<xs:sequence>
<xs:element minOccurs="1" maxOccurs="1" ref="title"/>
<xs:element minOccurs="1" maxOccurs="1" ref="y"/>
<xs:choice>
<xs:element minOccurs="0" maxOccurs="1" ref="for"/>
<xs:element minOccurs="0" maxOccurs="1" ref="ep"/>
</xs:choice>
<xs:element minOccurs="1" maxOccurs="1" ref="when"/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element name="title">
<xs:complexType mixed="true">
<xs:attribute name="type" use="required">
<xs:simpleType>
<xs:restriction base="xs:token">
<xs:enumeration value="tvseries"/>
<xs:enumeration value="videogame"/>
<xs:enumeration value="film"/>
</xs:restriction>
</xs:simpleType>
</xs:attribute>
</xs:complexType>
</xs:element>
<xs:element name="y">
<xs:complexType>
<xs:simpleContent>
<xs:extension base="yeartype">
<xs:attribute name="N" use="optional">
<xs:simpleType>
<xs:restriction base="xs:token">
<xs:enumeration value="I"/>
<xs:enumeration value="II"/>
<xs:enumeration value="III"/>
<xs:enumeration value="IV"/>
<xs:enumeration value="V"/>
<xs:enumeration value="VI"/>
<xs:enumeration value="VII"/>
<xs:enumeration value="VIII"/>
<xs:enumeration value="IX"/>
<xs:enumeration value="X"/>
<xs:enumeration value="XI"/>
<xs:enumeration value="XII"/>
<xs:enumeration value="XIII"/>
<xs:enumeration value="XIV"/>
<xs:enumeration value="XV"/>
<xs:enumeration value="XVI"/>
<xs:enumeration value="XVII"/>
<xs:enumeration value="XVIII"/>
<xs:enumeration value="XIX"/>
<xs:enumeration value="XX"/>
<xs:enumeration value="XXI"/>
<xs:enumeration value="XXII"/>
<xs:enumeration value="XXIII"/>
<xs:enumeration value="XXIV"/>
<xs:enumeration value="XXV"/>
<xs:enumeration value="XXVI"/>
<xs:enumeration value="XXVII"/>
<xs:enumeration value="XXVIII"/>
<xs:enumeration value="XXIX"/>
</xs:restriction>
</xs:simpleType>
</xs:attribute>
</xs:extension>
</xs:simpleContent>
</xs:complexType>
</xs:element>
<xs:element name="for">
<xs:simpleType>
<xs:restriction base="xs:token">
<xs:enumeration value="TV"/>
<xs:enumeration value="V"/>
<xs:enumeration value="VG"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
<xs:element name="ep">
<xs:complexType mixed="true">
<xs:attribute name="s" type="xs:integer" use="optional"/>
<xs:attribute name="e" type="xs:integer" use="optional"/>
</xs:complexType>
</xs:element>
<xs:element name="when">
<xs:complexType>
<xs:choice>
<xs:sequence>
<xs:element name="y" type="yeartype" minOccurs="1" maxOccurs="1"/>
</xs:sequence>
<xs:sequence>
<xs:element name="f" type="yeartype" minOccurs="1" maxOccurs="1"/>
<xs:element name="t" type="yeartype" minOccurs="1" maxOccurs="1"/>
</xs:sequence>
</xs:choice>
</xs:complexType>
</xs:element>
<xs:simpleType name="yeartype">
<xs:restriction base="xs:string">
<xs:pattern value="[12?][0189?][0-9?][0-9?]"/>
</xs:restriction>
</xs:simpleType>
</xs:schema>
Je m'attends à ce qu'il y ait un convertisseur xml-to-json quelque part, pour les croyants ..
Questions connexes
- 1. souhaite créer un fichier .php qui lit un fichier .xml et fournit une sortie xml à partir du fichier .xml
- 2. Comment créer XDocument à partir du fichier XML ressource incorporée
- 3. Comment créer un fichier XML?
- 4. Créer un fichier XML à partir de xsd avec xlinq
- 5. Comment créer un nouveau fichier XML à partir d'ElementTree?
- 6. Comment créer un fichier XML à partir d'un XmlReader?
- 7. Créer un fichier XML à partir d'une requête sharepoint?
- 8. valeur unique à partir du fichier xml
- 9. Comment créer un fichier GIF à partir d'un autre fichier de format en C++
- 10. rechercher un jeu de données à partir du fichier xml
- 11. Fichier XML BizTalk dans un format de fichier plat
- 12. Créer un fichier Excel au format html
- 13. Créer un fichier PDF à remplir à partir du PDF
- 14. Schéma/format XML pour représenter un format de fichier générique?
- 15. Comment créer un fichier de schéma XSD à partir d'un fichier XML?
- 16. Écrire un fichier XML à partir du noeud spécifié?
- 17. Comment créer un fichier .MAP à partir d'un fichier .PDB
- 18. Comment créer une liste html à partir du fichier xml plat en utilisant XSLT
- 19. Créer un fichier wmv à partir du code?
- 20. Lire RSAPublicKey en Java à partir du fichier XML
- 21. Comment ajouter un fichier XML à un autre fichier XML
- 22. Format de fichier du fichier spouleur
- 23. Comment créer un fichier XML à partir d'une autre méta-donnée xml?
- 24. Comment créer un fichier json à partir d'un fichier plist?
- 25. Création d'un fichier Office Open XML Format
- 26. Comment créer un fichier XML à partir d'un fichier Excel dans .NET?
- 27. Chargement dynamique du contenu NSPopUpButton à partir du fichier XML
- 28. Créer un fichier PDF à partir de CSV sur iPhone
- 29. Comment créer un fichier XML à partir du contrôle Datagridview dans l'application Windows Form?
- 30. Générer un fichier XML à partir de données de modèle
Je n'ai aucune idée de ce à quoi ressemble un fichier ".LIST". S'il vous plaît ajouter un échantillon. – Tomalak
par exemple movies.list à partir de cette page: ftp://ftp.fu-berlin.de/pub/misc/movies/database/ – gaponte69
Désolé, je ne peux pas accéder aux serveurs FTP d'où je travaille. Je pense que c'est mieux si vous ajoutez les informations pertinentes à la question afin que tout soit en un seul endroit. – Tomalak