2009-10-06 6 views
0

J'ai été invité à publier un livre complet en ligne de la même manière que Google Books? c'est-à-dire qu'il est visible et imprimable mais non téléchargeable.Comment fonctionne Google Livres? Y a-t-il des alternatives open source?

Le processus est-il fondamentalement un "balayage de haute qualité"? existe-t-il une solution open source à la "génération de masse" de "filigrane" sur ces images de haute qualité. Supposons que vous avez une image originale. et quand l'utilisateur l'affiche en ligne, je recrée l'image ajouter un filigrane et un autre texte sur le dessus de l'image "à la volée" existe-t-il une bibliothèque en python bien sûr :)

Des conseils? Si vous l'avez déjà fait, partagez s'il vous plaît.

Merci

+0

Pourquoi votre première phrase est-elle une instruction qui se termine par un?. Downvoted. –

+0

Trouble de la langue européenne que vous connaissez :) – wailer

Répondre

4

Malheureusement Google utilise une technique brevetée pour la numérisation des livres il est, donc vous devrez probablement tenir aux méthodes traditionnelles.

Google a créé une technologie de sérieux nifty caméra infrarouge qui détecte la forme en trois dimensions et l'angle de pages d'un livre lorsque le livre est placé dans le scanner. Cette information est transmise au logiciel OCR , qui ajuste les distorsions et permet au logiciel OCR de lire le texte plus précisément. Fini les fixations cassées, pas plus plaques de verre inefficaces.

Fondamentalement, vous aurez besoin de numériser le livre en utilisant une application OCR (Tesseract est bonne), alors je générer un PDF/image à partir du texte numérisé, et enfin ajouter le filigrane sur le dessus. Le Python Imaging Library semble être le meilleur outil pour cela.

0

Voir la question slashdot sur la reproduction de la technique de grille photo + laser de Google.