J'essaie d'analyser certains domaines Web (des dizaines de milliers) pour voir s'ils contiennent des mots anglais.Comment trouver si les mots anglais existent dans la chaîne
Il est facile pour moi d'analyser les domaines pour saisir la partie principale du domaine avec tldextract
puis j'ai essayé d'utiliser enchant
pour voir s'ils existent dans le dictionnaire anglais.
Le problème est que je ne sais pas comment diviser les domaines pour plusieurs mots à vérifier, à savoir latimes
retours comme faux, mais times
serait de retour si vrai.
Est-ce que quelqu'un sait une manière intelligente de regarder s'il y a un mot anglais contenu dans les chaînes?
Merci!
ce n'est certainement pas la meilleure façon de résoudre tout problème que vous essayez de résoudre ... et dans beaucoup de cas, il peut toujours être ambigu –
des suggestions? J'essaie de séparer une liste de domaines anglais et espagnol en deux listes. – Mojo713
whynot lookthem up avec whois? –