Existe-t-il quelque chose d'une notion [directionnelle?]/Implémentation de la distance entre les catégories/pages Wikipedia?Wiki-distance: distance entre les rubriques et catégories Wiki?
Par exemple considérer: A) "Université Saint-Louis" B) "université"
Il est clair que "A" est un type de "B". Comment pouvez-vous extraire ceci de Wiki? Si vous extrayez toutes les catégories se connecter à un, vous verriez qu'il donne
Category:1818 establishments in Missouri Territory
Category:Articles containing Latin-language text
Category:Association of Catholic Colleges and Universities
Category:Commons category with local link same as on Wikidata
Category:Coordinates on Wikidata
Category:Educational institutions established in 1818
Category:Instances of Infobox university using image size
Category:Jesuit universities and colleges in the United States
Category:Roman Catholic Archdiocese of St. Louis
Category:Roman Catholic universities and colleges in Missouri
et il ne contient rien qui se connecter directement à B (https://en.wikipedia.org/wiki/University). Mais essentiellement si vous regardez plus loin, vous devriez être capable de trouver un chemin multi-hop entre A et B, éventuellement plusieurs sauts. Quelles sont les façons populaires d'accomplir cela?
vous pouvez envisager de regarder dans mon projet sur l'extraction de la hiérarchie des catégories Wikipédia - https://github.com/wasiahmad/Mining-Wikipedia/tree/master/WikiNomy –
@WasiAhmad En quoi votre projet diffère-t-il de l'accès aux informations Wiki via MediaWiki api? – Daniel
Mon projet n'utilise aucune API, il extrait la hiérarchie de catégories directement à partir du vidage Wiki. J'avais besoin de toute la hiérarchie des catégories Wiki pour l'un de mes travaux de recherche, j'ai donc développé ce projet. –