2010-11-14 6 views
1

Je sais qu'il est impossible d'empêcher les gens de voler nos données, mais j'ai une grande base de données et je veux au moins empêcher les scripts automatisés de voler ma base de données.Empêcher le vol de données

Mes idées à ce jour:

  • utiliser JavaScript ou encode HTML = lourd et pourrait facilement être décodé
  • recaptcha pour la recherche = aucun moyen, les utilisateurs vont tout simplement quitter mon site
  • insérer des données aléatoires et les balises dans le site HTML pour éviter regex rip = bien?

Toutes les idées sont appréciées. Pourquoi les gens voudraient-ils voler votre base de données?

+1

Ce n'est pas un effort valable. Tout le temps passé à s'inquiéter des gens qui volent vos données est du temps perdu. Vous pourriez aussi bien vous inquiéter que les gens liront vos données, et "copier" dans leur cerveau. * Par conception *, il n'y a aucun moyen de permettre au navigateur d'afficher des données tout en empêchant la copie de ces données. – meagar

Répondre

0

Je pense qu'Alexia insère des balises aléatoires dans le balisage, et cela m'a donné un temps fou quand j'ai essayé de l'exploiter ... ils ont mis des balises supplémentaires dans les classements Alexa, comme <span class="a5r">35</span><span class="et4">52</span><span class="arer">16</span> et sauf si vous avez téléchargé le style feuille aussi et regarda les règles de rendu, vous ne pouviez pas comprendre quel numéro était censé être. Mais ... si j'avais été assez patient, j'aurais pu "rendre" les nombres et ensuite l'extraire, mais ça n'en valait pas la peine pour moi. Limiter les demandes de page à une quantité humainement possible fonctionnerait probablement bien (50/min ou quelque chose).

2

Pourquoi est-ce important si c'est le cas? Leur demander de ne pas être suffisant? Rendez votre politique claire et assurez-vous que le service juridique de votre entreprise a vérifié le libellé. Décourager la syndication non autorisée en précisant que cela n'est pas autorisé et que vous prendrez des mesures légales pour l'empêcher.

Ou mieux encore, encourager la syndication autorisée. Les gens n'effectueront une syndication non autorisée que s'il n'y a pas de moyen sensé de le faire d'une manière autorisée.

Les mesures techniques pourraient avoir un effet, mais ne feraient que dissuader celles qui ne sont pas particulièrement compétentes ou déterminées.

1

Aucune des solutions que vous avez proposées ne fonctionnera. Un bon scripteur pourrait facilement les contourner. Mais, il existe une solution technique à ce problème du côté de l'application serveur: implémenter une limite de débit. N'autorisez qu'une recherche à partir d'une adresse IP donnée une fois toutes les 10 secondes, par exemple. Cela rendra l'exploration de données automatisée de votre site très lente.