Distributed Proofreaders 528 books posted to PG from DP!   Visit DP-INT 
  DP » Fragen und Antworten zum Scannen
ID: Password:  ·  Register ·  Help 
 

Fragen und Antworten zum Scannen

Richtlinien zum Scannen und Einliefern
Muß ich Abbyy Finereader benutzen?
Welche Art von Scanner sollte ich beschaffen?
Sollte ich einen Scanner mit automatischem Dokumenteneinzug besorgen?
Was für einen Scanner verwendet charlz?
Was kostet denn ein solcher Super-Scanner?
Meine Scans kommen sehr schlecht heraus, irgendwelche Ratschläge?
Kann ich eine Digitalkamera verwenden, um die Bilder zu scannen?
Wie lange dauert es, ein Buch zu scannen?
Ich habe einen Scanner aber keine geeigneten Bücher /
Ich habe mehrere Bücher, die ich auf die Website bringen möchte, aber ich habe keinen Zugang zu einem Scanner /
Ich habe Scan-Bilder eines Buches aber keine Texterkennungs-Software

Ich besitze keinen Computer; wie ich helfen?
Ich verwende Linux. Gibt es ein Texterkennungs-Paket, das ich verwenden kann?
Wenn wir schon von Linux reden: Welche Scanner werden unterstützt?
Gibt es frei erhältliche Texterkennungs-Pakete?

Muß ich Abbyy Finereader benutzen?

Nein, natürlich nicht. Die Scan-Richtlinien sind auf die Verwendung dieses Programms ausgerichtet, weil die Mehrheit der Leuten, die bei dieser Website mitarbeiten, dieses Programm benutzt. Deshalb gibt es einfach mehr Leute da, die Fragen zu diesem Programm beantworten können als zu anderen Programmen. Sie brauchen nicht die neueste Version anzuschaffen, Version 5.0 ist für fast alles geeignet, was die meisten Leute damit tun wollen. (Die großen Drei: charlz, aldorondo und JulietS brauchen alle die Version 5.0 Pro.) Diese Version ist immer noch bei vielen Software-Händlern zu einem viel günstigeren Preis als die neueste Version erhältlich. Oft können Sie auch gebrauchte Exemplare bei EBay finden. Meiden Sie, falls möglich, die Home-Version und die Sprint-Version. Diesen fehlen eine Menge Funktionen, die die Arbeit wesentlich erleichtern.

Zwei andere Pakete, die erfolgreich im Einsatz sind: OmniPage Pro 10 und 11, sowie TextBridge Millenium Pro. Beide Programme haben gute Erkennungsraten und ähnliche Funktionen, was die Automatisierung der Scan-Abläufe betrifft. Sie unterscheiden sich in Einzelheiten, aber die jeweilige Dokumentation sollte genügen, um Sie auf den richtigen Weg zu bringen. Auch OEM Programme, die mit Scannern mitgeliefert wird können verwendet werden... Sie sollten jedoch daran denken, dass die Erkennungsgenauigkeit meist viel niedriger ist, und dass Sie bereit sein müssen, ein Menge Mehrarbeit für die Speicherung und manuelle Formatierung in Kauf zu nehmen.


Welche Art von Scanner sollte ich beschaffen?

Nun, es gibt eine große Auswahl. Im Allgemeinen sollten Sie einen Flachbett-Scanner verwenden. Der typische Scanner, den Sie in einem Computer-Geschäft finden werden, ist etwas größer als eine A4 Seite (oder als das "Letter" Papierformat, falls Sie in den USA leben), und wird gewöhnlich mit einer von drei möglichen Schnittstellen geliefert: SCSI, USB und Parallel. SCSI ist die schnellste Schnittstelle, kann aber zusätzliche Hardware benötigen, um den Scanner an den Computer anzuschließen. Die meisten Computer sind heutzutage mit einer USB-Schnittstelle ausgerüstet und Scanner, die diese Schnittstelle verwenden sind normalerweise bei der Installation am einfachsten. Die Parallel-Schnittstelle ist die langsamste, kann aber die einzige realistische Möglichkeit sein, um den Scanner an ältere Computer anzuschließen. Es gibt auch einige Scanner, die Firewire- und USB2-Schnittstellen unterstützen; diese sind aber oft teurer und auf eine bestimmte Anwendung ausgerichtet. Was Sie meiden sollten, sind die Hand-Scanner, bei denen Sie die Scan-Linse von Hand über eine Textseite führen. Es kann schon schwierig sein, die benötigte gleichmäßige Bewegung ein bis zwei Mal auszuführen, geschweige denn die 300 bis 400 Mal, die nötig sind bei einem ganzen Buch. Manche Hand-Scanner sind auch nicht breit genug, um eine ganze Seite in einem Durchgang zu scannen; bei diesem müssen die Scan-Bilder wieder "zusammengenäht" werden; dieser Vorgang kann mühsam sein, und viel Zeit benötigen.


Sollte ich einen Scanner mit automatischem Dokumenteneinzug besorgen?

Dies ist vor allem eine Frage des persönlichen Geschmacks. Automatischer Dokumenteneinzug (englisch ADF: Automatic Document Feed) kann das Scannen wesentlich beschleunigen. Seien Sie Sich jedoch bewusst, dass bei der Verwendung des automatischen Dokumenteneinzugs das Buch zerstört werden muss. Dies ist wahrscheinlich nicht realistisch für seltene oder wertvolle Bücher. Automatischer Dokumenteneinzug ist oft als Zusatz für einen normalen Scanner erhältlich, und kann aufgesetzt und bei Bedarf wieder entfernt werden. Sie müssen also den automatischen Dokumenteneinzug nicht verwenden auch wenn Sie einen besitzen. Wenn Sie die zusätzlichen Kosten verantworten können, so kann es einige Dinge erleichtern und beschleunigen, aber es handelt sich dabei keinesfalls um eine Notwendigkeit.


Was für einen Scanner verwendet charlz?

Fujitsu FI-4340C Flachbett mit Unterstützung für Farbe und doppelseitiges Scannen, sowie automatischen Dokumenteneinzug.

Super Scanner

Der Prozess den wir (Charles Franks) verwenden, geht so: wir reißen die Buchdeckel vom Buch (Keuch), hacken die Ränder auf allen vier Seiten des Buch ab (Doppel-Keuch!), schicken das Buch durch den automatischen Dokumenteneinzug, und lassen es dann durch die Website laufen.


Was kostet denn ein solcher Super-Scanner?

Rund 3500 USD.

Wow...

Yep.


Meine Scans kommen sehr schlecht heraus, irgendwelche Ratschläge?

Es hängt davon ab, was an den Scan-Bildern nicht stimmt. Die Normaleinstellungen der Texterkennungs-Software sind üblicherweise ziemlich gut. Stellen Sie sicher, dass Sie eine Einstellung für Text oder OCR (englisch: Optical Character Recognition: Texterkennung) verwenden, falls eine solche vorhanden ist. Scannen Sie in Schwarzweiß nicht in Farbe. Eine Auflösung von 300 dpi oder 400 dpi ist in Ordnung außer wenn Ihr Text extrem klein ist. Eine höhere Scan-Auflösung erzeugt viel größere Bilddateien und diese können sehr rasch unhandlich werden. Versuchen Sie die Helligkeit hoch oder runter zu stellen, um trübe oder verwaschene Bilder zu reinigen. Experimentieren Sie ein wenig. Es ist eine gute Idee einige Test-Scans durchzuführen und an ihnen die Texterkennung zu prüfen, bevor Sie das ganze Buch verarbeiten. Wenn Sie Abbyy verwenden, um den Text zu erkennen, können Sie Abbyy die Helligkeitseinstellungen kontrollieren lassen statt des TWAIN-Treibers. Abbyy wird die Helligkeit anpassen, um brauchbare Scan-Bilder zu produzieren; es verlangsamt den Scan-Prozess jedoch beträchtlich besonders auf langsameren Computern. Stellen Sie sicher, dass Sie den Rücken des Buches hinunter pressen, um die Seiten flach gegen das Scanner-Bett zu drücken. Zu starkes "Zelten" wird eine Drift verursachen, die aussieht, als würde der Text in einer Kurve aus der Seite laufen.


Kann ich eine Digitalkamera verwenden, um die Bilder zu scannen?

Diese Frage taucht immer wieder auf, besonders seit Digitalkameras immer besser und billiger werden. Die Antwort ist... vielleicht. Wenn Sie eine Kamera besitzen, die Sie im Nahbereich fokussieren können, die Seite gut und gleichmäßig ausleuchten (verlassen Sie Sich nicht auf Blitzfotographie), im Idealfall die Kamera auf einem Stativ montiert haben, um Bewegungen zu reduzieren, und sicherstellen, dass die Seite so flach als möglich liegt. Stellen Sie Ihre Kamera für hohe Bildqualität und hohe Auflösung in Schwarzweiß ein. Drehen Sie Ihre Bilder, schneiden Sie sie zu, und wandeln Sie sie nach Bedarf um. Starten Sie Ihr Texterkennungsprogramm und lassen Sie es laufen. Ja, Sie können wahrscheinlich brauchbare Scan-Bilder erhalten, aber stellen Sie Sich auf eine relativ geringe Genauigkeit der Texterkennung ein, es sei denn Sie wären besonders gut, oder hätten besonderes Glück.


Wie lange dauert es, ein Buch zu scannen?

Es hängt von der Geschwindigkeit und der Ausrüstung Ihres Scanners ab, sowie vom Zustand und dem Umfang des Buches. Ein Hochgeschwindigkeits-Scanner mit automatischem Dokumenteneinzug verarbeitet ein Buch mit 400 Seiten in gutem Zustand in weniger als 10 Minuten. Mit einen gewöhnliche Flachbett-Scanner, auf dem Sie die Seiten von Hand blättern, können Sie wahrscheinlich alle 20 bis 40 Sekunden ein Scan-Bild erstellen, sobald Sie in den Rhythmus kommen. Dies entspricht 3 bis 6 Seiten pro Minute (zwei Seiten pro Bild), 180 bis 360 Seiten pro Stunde. Kleinere Probleme und kurze Pausen eingerechnet, sollte ein 400-Seiten-Buch in der Größenordnung von zwei Stunden zum Scannen benötigen.


Ich habe einen Scanner aber keine geeigneten Bücher /
Ich habe mehrere Bücher, die ich auf die Website bringen möchte, aber ich habe keinen Zugang zu einem Scanner /
Ich habe Scan-Bilder eines Buches aber keine Texterkennungs-Software

Stellen Sie eine Nachricht mit Ihrer Anfrage in das Forum mit Namen "Content Provider". Wir haben mittlerweile mehr als 5000 Nutzer. Es gibt sicher jemanden, der das Gegenstück zu Ihnen hat. Wir haben keinen formalen Prozess, um diese Leute miteinander in Kontakt zu bringen. Wenn Sie Bücher haben, die Sie nicht wieder brauchen, so können Sie sie wahrscheinlich an charlz (Charles Frank) senden, so dass er sie durch seinen "Super-Scanner" laufen lassen kann. Schicken Sie ihm eine Nachricht in den Foren oder eine E-Mail um das Verfahren abzusprechen. Falls Sie Bilder haben, die eine Texterkennung benötigen, und Sie keinen Partner dafür finden können, treten Sie mit JulietS in Kontakt, oder einem der zwei Charles’s Aldarondo oder Charlz, und sie werden versuchen die Texterkennung zu arrangieren. Stellen Sie bitte sicher, dass die Bilder sequentielle Namen aufweisen und im richtigen Format vorliegen, so wie es die Scan-Richtlinien beschreiben.


Ich besitze keinen Computer; wie ich helfen?

Wie schauen Sie Sich denn diese Seite an? Wow, Sie lassen Sich durch nichts abhalten! Nun, wir können immer Geld brauchen, um neue (alte) Bücher zu kaufen, neue Software zu beschaffen, neue Super-Scanner für charlz (wenn es so weiter geht früher, als wir gedacht haben) oder anderes Kleinmaterial. Finden Sie oder spenden Sie Bücher, die jemand anderes scannen kann. Gehen Sie in Ihre lokale Bibliothek, viele haben Computer, auf denen sie den öffentlichen Zugang zum Internet erlauben. Sie können Sich anmelden und gelegentlich einige Seiten Korrektur lesen.


Ich verwende Linux. Gibt es ein Texterkennungs-Paket, das ich verwenden kann?

Es sind einige Pakete verfügbar. Das am weitesten Entwickelte (als dieses Dokument geschrieben wurde) ist Clara OCR ein Texterkennungs-Paket, das unter der Free-GPL Lizenz erhältlich ist. Seine Erkennungsgenauigkeit ist aber schlecht, und es wird zur Zeit nicht empfohlen. (Ende 2002). Hoffentlich wird es sich im Lauf seiner Entwicklung verbessern. Es gibt auch einige kommerzielle Produkte, die auf UNIX/Linux laufen, aber sie sind oft sehr teuer (einige Tausend USD). Wahrscheinlich tun Sie Sich am bestem mit einem Windows- oder Mac-Benutzer zusammen, und lassen ihn die Texterkennung auf Ihren Scan-Bildern durchführen. Oder arrangieren Sie Sich mit JulietS, Aldarondo oder charlz, um einen von ihnen die Texterkennung für Ihre Scan-Bilder durchführen zu lassen.


Wenn wir schon von Linux reden: Welche Scanner werden unterstützt?

Was Sie vermutlich wissen sollten, ist, welche Scanner mit den SANE-Treiber (englisch: Scanner Access Now Easy: Scanner-Anschluss nun einfach) kompatibel sind. Gehen Sie hierhin, um die Kompatibilität zu überprüfen.

Die Homepage von SANE ist hier.


Gibt es frei erhältliche Texterkennungs-Pakete?

Hier sind ein paar:

http://www.simpleocr.com/(Windows)

http://www.claraocr.org/ (Linux)

http://jocr.sourceforge.net/ (Linux)

http://www.expervision.com/webtr6.htm (Windows)

http://ftp.cityu.edu.hk/pub/chinese/ifcss/unix/ocr/omniocr2.2.README (UNIX - Chinesisch)

http://http.cs.berkeley.edu/~fateman/kathey/ocrchie.html (Linux)

Seien Sie Sich bewusst dass Sie in der Texterkennungs-Welt typischerweise bekommen, wofür Sie bezahlen.