Supposons que vous ayez un référentiel de 10 000 noms de fonctions et éventuellement leur fréquence d'utilisation dans un corpus de code qui peut être en C/C#/C++. (Ils ont différentes conventions habituellement prescrits)Comment prévoir si le nom de la fonction suit la convention
Certains échantillons peuvent être:
DoPaint
OnPaint
CloseWindow
DeleteGraphOnClose
FreeConnection
ConnectInternat (smallTypo, but part of code)
FreeSoH
maintenant donné un nom de fonction, comment peut-on prédire si le nom suit la convention de Human Generated Nom?
Remarque:
- Il est évident que tous les noms de candidats seront des noms valides
- noms générés peuvent avoir des caractères arbitraires et seront traités comme des mauvais
- cas de lettre peuvent se brouillées jusqu'à
Quelques candidats:
Z090292 - not likely
onDelete - likely
CloseWindow - likely
iGetIndex - unlikely
Les pointeurs sur technique et logiciel sont les bienvenus
Notez également que je suis principalement intéressé par la probabilité du nom, pas si elles existent vraiment, qui peut être la plupart du temps trouvé à l'aide des outils d'analyse de code –