Vous ne pouvez pas empêcher les robots et les robots d'exploration de parcourir un site accessible au public. Si une personne avec un navigateur peut le voir, alors un bot ou un crawler peut le voir (mise en garde ci-dessous). Cependant, il y a quelque chose qui s'appelle le Robots Exclusion Standard (ou norme standard robots.txt), qui vous permet d'indiquer aux bots et aux robots d'exploration bien comportés qu'ils ne doivent pas indexer votre site. This site, ainsi que Wikipedia, fournissent plus d'informations. L'inconvénient de ce qui précède est que ce que vous voyez sur votre navigateur, un bot peut voir, est la suivante: la plupart des robots simples n'incluent pas de moteur Javascript, donc tout ce que le navigateur affiche à cause du code Javascript pas être vu par un bot. Je suggère que vous n'utilisiez pas cela comme un moyen d'éviter l'indexation, puisque la norme robots.txt ne repose pas sur la présence de Javascript pour assurer un rendu correct de votre page.
Une fois dernier commentaire: les robots sont libres d'ignorer cette norme. Ces robots sont mal comportés. L'essentiel est que tout ce qui peut lire votre HTML peut faire ce qu'il aime avec.