2017-05-03 2 views
0

Existe-t-il un moyen de rechercher sur le Web des mots commençant par une ou plusieurs lettres, mais se terminant par une séquence fixe? Par exemple, je voudrais une recherche sur * otus pour retourner lotus, POTUS, SCOTUS, Hérodote, etc.moteur de recherche pour les terminaisons de mots

Il y a beaucoup d'outils qui font cela pour un ensemble limité, comme un dictionnaire ou un corpus. Par exemple, allwords.com a une option pour "mots se terminant par". Cependant, il recherche un très petit ensemble de texte. Je cherche à chercher tout le web.

Merci pour toute aide que vous pouvez offrir.

David

Répondre

2

Voici un mot de recherche modifié pour la langue.
Depuis que vous effectuez une recherche sur le Web, celui-ci utilise Unicode.
Je peux le faire pour ascii seulement si nécessaire.

Le mot réel est capturé dans groupe 2.

(?i)([^\pL\pN]*([\pL\pN](?:[\pL\pN_-]|\pP(?=[\pL\pN\pP_-])|[?.!])*otus)(?:\pP(?=[\pL\pN\pP_-])|[?.!])*(?=[^\pL\pN]|$))

https://regex101.com/r/HrFrEM/3

Formatted

(?i) 
(       # (1 start) 
     [^\pL\pN]*     # Not letters/numbers 
     (       # (2 start), Followed by letter/number 
      [\pL\pN] 
      (?: 
       [\pL\pN_-]     # Letter/number or '-' 
      | 
       \pP       # Or, punctuation if followed by punctuation/letter/number or '-' 
       (?= [\pL\pN\pP_-]) 
      | 
       [?.!]       # Or, (Add) Special word ending punctuation 
      )* 
      otus       # Ends with this 
    )        # (2 end) 
     (?: 
      \pP       # Or, punctuation if followed by punctuation/letter/number or '-' 
      (?= [\pL\pN\pP_-]) 
     | 
      [?.!]       # Or, (Add) Special word ending punctuation 
    )* 
     (?= [^\pL\pN] | $) 
)        # (1 end) 
0

Oui, il y a un moyen.

Vous pouvez commencer par créer une boucle for qui effectuera un reverse DNS sur toutes les adresses IP possibles entre 0.0.0.0 et 255.255.255.255 (vous pouvez exclure les ports restreints si vous le souhaitez).

Félicitations, vous avez maintenant toutes les URL de tous les sites Web dans le monde.

Vous pouvez ensuite créer une boucle for qui parcourra tous ces domaines, chargera la page d'accueil et chargera les hyperliens de manière récursive. Félicitations, vous avez maintenant tout le web!

Enregistrer dans un dossier (à savoir web/)

Puis

cat web/* | grep otus 
+0

Ha! Merci à vous deux. Toutes mes excuses, mais je n'ai pas réalisé à quel point stackoverflow est exclusivement codé (le nom aurait dû le donner, je sais). Je ne suis pas un programmeur, donc j'ai besoin d'un outil de site web/moteur de recherche qui peut faire une recherche de "fin de mot" pour moi. Des pensées? – David

+0

Je ne sais pas pourquoi cela est en attente, comme ma question (et f/u commentaire) semble assez bien défini et lié à moi. Mais ... c'est la vie. – David