2009-09-16 9 views
9

Ma lecture de ce article suggère qu'un avantage de ReCAPTCHA est qu'il peut avoir des humains vérifier les mots non reconnus dans l'OCR/numérisation des livres. Il le fait en utilisant ces mots dans "Es-tu humain?" tests. Alors ReCAPTCHA tue deux oiseaux avec une pierre. Génial!Comment fonctionne ReCAPTCHA?

Mais je ne comprends pas. Si le mot ne peut pas être reconnu par le processus de numérisation, alors qu'est-ce que l'entrée entrée, par l'être humain supposé, vérifiée? Comment cela marche-t-il?

Répondre

23

Il montre deux mots. L'un d'entre eux l'est déjà, l'autre ne le sait pas. Cela suppose que si vous connaissez le droit, vous devez connaître l'autre.

Vous ne savez pas lequel des deux est déjà connu alors vous, théoriquement, ne pouvez pas le tromper. De plus, il va rejouer un mot avec plusieurs personnes pour obtenir une confirmation indépendante avant de le renvoyer à la source (société de presse, groupe de numérisation de livres) comme une réponse valide.

Mais si un ordinateur ne peut pas lire un CAPTCHA , comment le système connaît la bonne réponse au casse-tête? Voici comment: Chaque nouveau mot qui ne peut pas être lu correctement par OCR est donné à un utilisateur en en conjonction avec un autre mot pour dont la réponse est déjà connue. L'utilisateur est invité à lire les deux mots. S'ils résolvent celui pour lequel la réponse est connue, le système suppose leur réponse est correcte pour le nouveau . Le système donne alors la nouvelle image à un certain nombre d'autres personnes à pour déterminer, avec une confiance plus élevée, si la réponse originale était correcte.

http://recaptcha.net/learnmore.html

+0

Je noterais que ReCAPTCHA fonctionne en montrant deux mots, un qu'il sait et un autre pas. Vous avez juste besoin d'en avoir un correct. Cependant, ils soumettent à nouveau ce qu'ils ne font pas plusieurs fois jusqu'à ce qu'ils obtiennent un pourcentage élevé que c'est correct avant de l'absorber comme tel. –

+0

Bon point, le système n'est pas infaillible, bien qu'il soit intelligent. Cela me rappelle le jeu Image Labeler de Google qui fonctionne selon les mêmes principes pour inciter les personnes inconnues à étiqueter des images: http://images.google.com/imagelabeler/ –

+0

Imagelabeler et ReCapcha sont du même type: Luis von Ahn. Il a vraiment montré la voie en utilisant des humains pour résoudre des problèmes difficiles. –

2

cité de LEARN HOW reCAPTCHA WORKS

Mais si un ordinateur ne peut pas lire un CAPTCHA, comment le système sait la bonne réponse au casse-tête? Voici comment: Chaque nouveau mot qui ne peut pas être lu correctement par OCR est donné à un utilisateur en conjonction avec un autre mot pour lequel la réponse est déjà connue. L'utilisateur est ensuite invité à lire les deux mots. S'ils résolvent celui pour lequel la réponse est connue, le système suppose que sa réponse est correcte pour le nouveau. Le système donne alors la nouvelle image à un certain nombre d'autres personnes pour déterminer, avec plus de confiance, si la réponse originale était correcte.