Le site allemand nandoo.net vous offre la possibilité de raccourcir un article de presse. Si vous modifiez la valeur en pourcentage avec un curseur, le texte change et certaines phrases sont ignorées.Raccourcissez un texte et ne gardez que des phrases importantes
Vous pouvez voir que dans l'action ici:
L'article de nouvelles est sur le côté gauche et les balises sont marquées. Le curseur se trouve en haut de la deuxième colonne. Plus vous déplacez le curseur vers la gauche, plus le texte devient court.
Comment pouvez-vous offrir quelque chose comme ça? Y a-t-il des algorithmes que vous pouvez utiliser pour y parvenir? Mon idée était que leur algorithme compte le nombre d'étiquettes et de noms dans une phrase. Ensuite, les phrases avec le moins grand nombre de tags/noms sont laissées de côté.
Cela pourrait-il être vrai? Ou avez-vous une autre idée?
J'espère que vous pouvez m'aider. Merci d'avance!
Merci beaucoup! Ensuite, il vous suffit de stocker le nombre d'occurrences de tous les mots dans votre base de données. Ce n'est pas un problème. Mais pourquoi avez-vous besoin d'une analyse bayésienne? Vous pouvez parcourir le texte, sélectionner la fréquence des mots et les compter pour chaque phrase. Droite? – caw
Vous ne devez pas utiliser les nombres purs car les mots qui sont naturellement plus abondants sont * attendus * pour avoir des comptes élevés, alors que vous recherchez des mots dont les comptes sont élevés * par rapport aux résultats attendus. L'analyse bayésienne fait exactement cela. –
Thx! Donc, je sélectionne le nombre moyen d'occurrences des mots de la base de données. Ensuite, je détermine quels mots apparaissent plus souvent dans ce texte que dans la moyenne. Au moins, je sélectionne les phrases qui contiennent ces mots fréquents inattendus.Droite? – caw