2017-09-20 1 views
0

Je dois développer une application pour détecter l'empreinte du plagiat dans les codes sources en utilisant un système cognitif, tel que Watson. À l'heure actuelle, j'utilise Jplag (https://github.com/jplag/jplag) pour analyser les codes source et obtenir des fichiers à jetons.IBM Watson: rechercher des modèles similaires entre les fichiers structurels

Voici mes problèmes, j'ai vu que Watson est un système très utilisé pour l'analyse de fichiers non structurés. Au lieu de cela, les fichiers à jetons sont hautement structurés et ne peuvent pas être analysés avec la plupart des services fournis par IBM Watson. Par exemple, Watson Discovery peut fournir des informations sur des sentiments ou des sujets, dans un e-mail ou une publication, et trouver des liens entre les fichiers qui composent le corpus. Malheureusement, Watson ne peut pas lire le fichier tokenized à cet effet (ou je ne sais pas comment le faire).

J'ai trouvé Watson Analytics et il devrait fournir une corrélation entre les fichiers numériques et les fichiers structurés. Mais je ne peux pas atteindre la période d'essai, donc je ne peux pas le tester.

Je me demande si je peux utiliser Watson Analytics pour mon but. Devrais-je insister de cette façon ou ai-je manqué une suggestion?

Répondre