2017-04-04 4 views
0

Nous avons un grand nombre de dépôts. Nous voulons implémenter une recherche de code basée sur la sémantique (fonctionnalité) sur ces dépôts. À l'heure actuelle, nous avons déjà mis en œuvre une recherche de code basée sur les mots clés dans laquelle nous avons parcouru tous les fichiers du référentiel et les avons indexés à l'aide de elasticsearch. Mais cela ne résout pas notre problème car certains référentiels sont mal commentés et documentés, donc la recherche de codes/bibliothèques spécifiques devient difficile.Recherche de code basée sémantique

Ma question est la suivante: est-il des bibliothèques opensource ou des travaux antérieurs réalisés dans ce domaine qui pourrait nous aider à indexer la sémantique des fichiers du référentiel, de sorte que la recherche du code devient facile et cela aussi nous aider à réutilisation des codes. J'ai trouvé quelques documents de recherche comme Semantic code browsing, Semantics-based code search etc mais étaient inutiles car il n'y avait pas de mise en œuvre réelle donnée. Alors pouvez-vous s'il vous plaît suggérer quelques bonnes bibliothèques ou des projets qui pourraient m'aider à atteindre la même chose.

P.S: -Par ailleurs, des sociétés comme Koders, Google, cocycles.com etc. ont commencé leur recherche de code en fonction des fonctionnalités. Mais la plupart d'entre eux ont mis fin à leurs activités sans donner de commentaires appropriés. Quelqu'un peut-il me dire à quel genre de difficultés ils sont confrontés?

Répondre

0

Je ne sais pas si c'est ce que vous cherchez, mais j'ai écrit https://github.com/google/zoekt, qui utilise la compréhension du code basée sur ctags pour améliorer le classement.