-2

J'ai besoin d'aide pour écrire un programme basé sur le code de ces liens link1 et link2 qui calculera automatiquement la similarité sémantique entre a. Phrases consécutives et b. Les phrases se séparent par 1 phrase intermédiaire, dans le document entier (1000 phrases). Le code fourni déjà segmenté et peut trouver une similarité sémantique, mais je n'ai aucune idée de la façon d'écrire le nouveau code qui calculera (et affichera) la similarité sémantique entre les phrases consécutives et "intervenantes" à travers le texte entier (a, b Je ne veux pas faire la même chose encore et encore.Trouver la cohérence sémantique entre les phrases dans un texte

+0

Avez-vous regardé [word2vec] (http://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf) ([ ou cela] (https://blog.acolyer.org/2016/04/21/the-amazing-power-of-word-vectors/)) du tout? J'ai utilisé son implémentation de Python pour quelque chose de similaire dans le passé. – Fruitspunchsamurai

+0

Bonjour, ces articles sont pour la plupart des théories que je comprends, j'ai du mal à appliquer les idées dans le code et à automatiser le processus. –

+1

Qu'avez-vous essayé jusqu'à présent? J'imagine que vous auriez une sorte de programme qui lit les fichiers ligne par ligne et les compare à la ligne suivante/phrase adjacente? – Fruitspunchsamurai

Répondre

0

Le code suivant devrait faire ce que vous voulez, ajustez-le en fonction de la façon dont vous voulez que la sortie soit formatée.

with open("sentence_file_name", "r") as sentence_file: 
    while x and y: 
    x = sentence_file.readline() 
    y = sentence_file.readline() 
    similarity(x, y, boolean) #boolean set to false or true depending on what you want 
    x = y 
    y = sentence_file.readline() 
+0

Je suis terriblement désolé mais où implémenteriez-vous ceci dans le code fourni dans le lien? –

+0

Copiez/fourchez tout de la ligne 1-245, puis ajoutez le code ci-dessous. Remplacez le nom_fichier_semaine par le chemin relatif de votre fichier de phrases. Ce n'est pas techniquement la façon propre de le faire, mais serait probablement le plus simple. – Fruitspunchsamurai