Je veux développer l'application google desktop search comme, je veux savoir quelles techniques d'indexation/algorithmes je devrais utiliser afin que je puisse récupérer très rapidement les données.Des algorithmes d'indexation pour développer une application comme google desktop search?
Répondre
La transformation Burrows-Wheeler, utilisée pour compresser des données dans bzip2, peut être utilisée pour que la recherche de sous-chaîne de texte soit une fonction à temps constant.
http://en.wikipedia.org/wiki/Burrows-Wheeler_transform
Je n'ai pas vu une simple introduction en ligne, mais voici beaucoup de détails:
Article intéressant, merci! –
En général, ce que vous voulez est un Inverted Index. Vous pouvez faire vous-même l'indexation, mais vous devez gérer stemming, stop words, en étendant la liste des écritures pour inclure des positions dans le document afin de pouvoir gérer les requêtes multi-mots, et ainsi de suite. Ensuite, vous devez stocker l'index, probablement dans un B-Tree sur le disque - ou vous pouvez vous faciliter la vie en utilisant une base de données existante pour le stockage sur disque, telle que BDB. Vous devez également écrire un planificateur de requêtes qui interprète les requêtes utilisateur, exécute query expansion et les convertit en une série d'analyses d'index. L'article de Wikipedia sur Search Engine Indexing fournit également un bon aperçu de tous les défis. Ou, vous pouvez tirer parti du travail existant et utiliser des solutions d'indexation de texte intégral prêtes à l'emploi comme Apache Lucene et Compass (qui est construit sur Lucene). Ces outils traitent pratiquement tout ce qui est détaillé ci-dessus (et plus), ce qui vous laisse simplement écrire l'outil pour construire et mettre à jour l'index en introduisant tous vos documents dans Lucene, et l'interface utilisateur pour permettre aux utilisateurs de le rechercher.
- 1. Windows Desktop Search via C#
- 2. Comment Google Desktop Search parvient-il à rester léger et rapide?
- 3. google search integration
- 4. Google Search API Backend
- 5. Google Search Engine - Cocoa
- 6. comment développer une application radio pour l'iphone
- 7. Quelle est une bonne méthode pour l'intégration Desktop & Application Web?
- 8. Développer une nouvelle application avec .NET?
- 9. Bonne façon de développer une grande application
- 10. Simple VB.NET utilisant Google Search API?
- 11. Sandboxing Google Custom Search Engine Styles
- 12. Règles pour développer une application Delphi Windows 7
- 13. Développer une application facebook avec C++
- 14. IFilter dll fonctionne sur Windows Desktop Search, mais pas sur SharePoint 2007
- 15. Algorithmes pour l'espacement visuel des objets
- 16. développer un bot pour utiliser comme contact gtalk avec java
- 17. Modèles pour développer des applications WCF
- 18. Plate-forme pour développer toutes les choses google?
- 19. Staff Alignement des algorithmes
- 20. Icônes à utiliser dans un programme qui génère des flux pour Google Search Appliance
- 21. Google Desktop Gadget à Vista Sidebar Gadget converter
- 22. Efficacité spatiale des algorithmes
- 23. Comment développer une application de dessin en Delphi
- 24. jquery hyperlinking comme google
- 25. Puis-je développer une application iPhone en utilisant java?
- 26. Quel serait un bon cadre pour développer une application web pour les logiciels de guitare?
- 27. Algorithmes de déduplication des données
- 28. Développer une application photo ASP.NET/MVC simple, comment faire?
- 29. Est-il possible de google search avec l'API gdata?
- 30. Google Chat comme Div
question est trop générale –
essayer de chercher B-Trees ... –
Y a-t-il d'autres techniques que les gens utilisent pour la récupération rapide de données? – SunnyShah