J'ai regardé le site Web de documentation de Heritrix, et ils ont énuméré un lecteur de dossier de Python. Cependant, il est 404 introuvable lorsque j'ai cliqué dessus. http://crawler.archive.org/articles/developer_manual/arcs.htmlComment lire les fichiers .ARC du robot d'indexation Heritrix en utilisant Python?
Est-ce que quelqu'un d'autre connaît un lecteur Heritrix ARC qui utilise Python?
(j'ai posé cette question, mais il fermé en raison de l'inexactitude)