Re : [WIKISOURCE] Scan. de livres

classic Classic list List threaded Threaded
1 message Options
Reply | Threaded
Open this post in threaded view
|

Re : [WIKISOURCE] Scan. de livres

Traroth
J'ai longuement cherché, mais je n'ai pas trouvé de solution libre pour faire de la Lecture Automatique de Document (LAD - Intelligent Document Recognition en anglais). Je n'ai pas l'impression que ça existe. Tout au plus, un petit script sans doute pas trop utile dans ton cas de figure ici :
http://blogcritics.org/archives/2006/01/31/222424.php

et un document qui peut peut-être t'avancer un peu ici :
http://rivetlogic.wordpress.com/2007/04/11/new-white-paper-on-open-source-document-management/

En espérant que ça puisse t'aider un peu...


Alexis


----- Message d'origine ----
De : Emmanuel Engelhart <[hidden email]>
À : Discussion à propos de l'association Wikimédia France <[hidden email]>
Envoyé le : Jeudi, 13 Décembre 2007, 11h29mn 46s
Objet : [Wikimediafr-l] [WIKISOURCE] Scan. de livres

Salut

Je cherche une solution libre pour traiter des pages d'écritures
scannées de livres à la chaîne

Je cherche un logiciel permettant de :
* Enlever les bordures noires et de manière générale les ombres
 (effet
de transparence)
* Re-équilibrer le texte par rotation simple.
* Re-découper automatiquement la page (par exemple 50px de marges
autour du bloc de texte)

Je ne trouve malheureusement rien et j'envisage donc de m'occuper
moi-même du problème.

Sachant que je suis tout nouveau face à ce problème, tout remarque,
tout conseil est le bienvenu.

Techniquement, j'envisage de faire un truc en script-fu (langage
scheme pour TheGimp). Cela en fera un outil libre, facile à modifier
et multi-plateforme ; en plus je n'aurai pas à m'occuper de la partie
algo. de traitement d'image.

Si vous avez aussi des échantillons de pages scannées en 300 dpi
 (voir
150), je suis aussi preneur (m'envoyer directement en privé). Cela me
permettrait d'évaluer une solution sur un panel large d'exemples.

Emmanuel

PS : Je viens de faire l'achat d'un AVISION FB6080E
(http://www.avision.de/?content=FB6080E). Ce scanner offre l'avantage
de scanner directement depuis la bordure de sa dalle. Sans être la
panacée, il permet de scanner des livres en réduisant beaucoup les
efforts au niveau de la reliure et au passage l'ombre (sur l'image) à
son niveau :
ce qui permet de scanner des livres (assez gros) inscannables autrement
(avec un scanner plat typique). Le tout fonctionne sous linux
parfaitement... avec quelques efforts ;)

_______________________________________________
Wikimediafr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediafr-l





      _____________________________________________________________________________
Ne gardez plus qu'une seule adresse mail ! Copiez vos mails vers Yahoo! Mail http://mail.yahoo.fr

_______________________________________________
Wikimediafr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediafr-l