2015-11-11 1 views
10

J'ai téléchargé le dump allemand dewiki-20151102-pages-articles-multistream.xml. Ma courte question est la suivante: que signifie le «multistream» dans ce cas?Multistream Wikipedia dump

Répondre

11

Les dumps sont compressés à l'aide de bz2, bz2 supporte une version parallèle lui permettant de compresser/décompresser des fichiers plus rapidement. Les données compressées utilisant la version parallèle sont marquées multistream. Connaître ces informations fait la différence lorsque vous traitez le vidage à partir d'un langage de programmation, puisque vous devez passer un drapeau pour indiquer à la bibliothèque comment le décompresser (parallèle ou non parallèle).

+0

Pourriez-vous s'il vous plaît répondre à cette question: https://stackoverflow.com/questions/48386791/extract-related-articles-in-different-languages-using-wikidata-toolkit?noredirect=1#comment84061677_48386791 – SahelSoft