J'ai un arbre de mot-clé hiérarchique, représentée comme une liste de tuples où le premier argument est le « chemin » et le second est le mot-clé correspondant:Mots clés correspondant hiérarchique à un document
keys = [('0','key1'),('0,1','key2'),('0,1,12','key3'),('0,2','key4'),('0,2,30','key5')]
Liste de connexion « chemins »et les documents correspondants (un doc peut avoir plus d'un « chemin »:
docs = [('0,1,12','doc1'),('0,2,30','doc1'),('0,1','doc2')]
Je veux correspondre chaque document aux mots-clés et de produire un résultat comme celui-ci:
docdict={doc1:[('key1','key2','key3'),('key1','key4','key5')],doc2:[('key1','key2')]}
Ma question est comment obtenir tout le mot-clé (parent) plus efficacement? Merci d'avance!