2008-10-26 8 views
4

Voici ce que j'ai sur ma liste jusqu'à présent. Je voudrais savoir d'autres dans la même veine, peut-être plus technique, peut-être moinsVous cherchez des livres sur les sciences de l'information, recherche d'information

déchiquetés: Votre vie, la liberté et le bonheur après l'explosion numérique - Ableson, Leeden et Lewis
Glut: Mastering informations à travers les âges - Wright
Règles d'information - Varian et Shapiro
Dragons Web: a l'intérieur des mythes de Search Engine Technology - Witten, Gori et Numerico

Il y a peu que je l'ai vu sur l'exploration de texte, ils inclure
Web Data Mining - Liu
Moderne Information Retrieval - Baeza-Yates, Ribiero-Neto

Aussi la recherche enr blog comme
http://www.stat.columbia.edu/~gelman/blog/
http://www.econlib.org/library/Enc/Information.html

ou des papiers comme
The Discovery of Structural Form

Répondre

2

Managing Gigabytes - Witten, Moffat, and Bell: un regard assez détaillé à certains des technologies derrière la recherche d'information, la compression de texte et d'images. (Disclaimer: mon superviseur universitaire est le deuxième auteur.)

Vous devriez également connaître le SIGIR d'ACM, qui organise une conférence annuelle sur la recherche d'information, et a aussi un mailing list.

+0

merci. J'allais mettre ce livre sur ma liste originale. J'apprécie les liens. –

3

Introduction to Information Retrieval semble être le texte recommandé ces jours-ci pour la technologie sous-jacente; il a été publié en 2008 et je ne l'ai pas encore lu. (Le texte intégral est libre en ligne.) Gérer les gigaoctets, comme recommandé par TimB, est mon livre plus ancien; il est beaucoup mieux écrit que Modern Information Retrieval, mais cela vaut aussi le coup d'oeil. Il y a plus que vous pouvez trouver avec the obvious search.

4
  • "SIGIR" - la conférence
  • "TREC" - la conférence
  • Baeza-Yates, Ribeiro-Neto, "Modern Information Retrieval" (1999)
  • Witten, "Gestion Gigaoctets" (1999)
  • van Rijsbergen, "Recherche d'Information" (1979)

sont les "bibles" évidentes (comme mentionné ci-dessus).

  • Büttcher, Clarke, Cormack, "Recherche d'information: mise en œuvre et l'évaluation des moteurs de recherche" (2010)

est un nouveau manuel intéressant (niveau des élèves), plein de références biliographic. Il contient une bonne explication des algorithmes de récupération en parallèle (exemple de chapitre).

  • Croft, Metzler, Strohman, "Moteurs de recherche: recherche d'information dans la pratique" (2009)

a de bonnes critiques; Je ne l'ai pas aimé trop (lisez les exemples de chapitres sur la page d'accueil de Croft).

  • Voorhees, Harman, "Trec: Expérience et évaluation dans la recherche d'information" (2009)

est une bonne introduction à l'approche TREC dans l'évaluation IR.

  • Langville, Meyer, "Pagerank de Google et au-delà: la science du moteur de recherche classement" (2006)

explique comment calculer efficently PageRank.

0

La récupération d'informations - Implémentation et évaluation des moteurs de recherche a été publié par la presse du MIT en 2010 et est un très bon livre sur l'acquisition de connaissances pratiques en recherche d'information. Stefan Buttcher, Charles Clarke et Gordon Cormack sont les auteurs de ce livre. Buttcher était le doctorant de Clarke, et Clarke était le doctorant de Cormack. Au total, ils ont combiné environ 50 ans de recherche et d'expérience dans ce livre. C'est un must à lire !!!

Questions connexes