J'ai écrit un webcrawler simle. J'ai récupéré tous les sites Web et mais sur mon disque dur. maintenant je veux les analyser, donc je pourrais écrire une interface simple comme www.google.de et rechercher des informations dans mes pages récupérées.webcrawler analyse des pages trouvées
le problème est de savoir comment trouver les informations importantes de manière "rapide". donc le calcul est important. cela pourrait être en temps réel ou après le fetch. mon idée est d'écrire un dicton avec une liste de mots anglais et compter les entrys ... ou quoi faire? J'ai besoin de cours pour extraire des informations et les compresser. mais je ne sais pas où regarder.
le crawler est basé sur C++ avec mysql où les liens sont stockés.
J'espère que ma question est claire. : D
BTW SRY pour mon mauvais anglais mais il ISTN un conseil comme celui-ci en allemand: P
hey, merci, c'est ce que je cherche: P – Roby