So scannen Sie effektiv 130.000 Papierseiten in 10 Tagen

897
Gryph

Ich habe ein ziemlich großes Projekt, das letztendlich der Gesellschaft zugute kommen wird, und ich suche alle Hilfe, die ich sammeln kann. Ich habe etwa 130.000 Seiten, die digitalisiert werden müssen. Viele von ihnen sind in Paketen mit Heftklammern oder auf Papier, das mindestens 40 Jahre alt ist (und im Vergleich zum heutigen Papier recht dünn ist). Einige davon haben eine seltsame Größe (Vollformat, Karten und kleine Postkartenformate). Wir haben jedoch nur ~ 10 Tage Zeit, um diese Arbeit zu erledigen (sobald wir vor Ort angekommen sind). Wir könnten die Nacht durcharbeiten.  

Ich habe ein Team von 6 Leuten und wir haben ein relativ kleines Budget, um diese Aufgabe zu erfüllen. Wir haben über moderne Scanner nachgedacht (z. B. einen Fujitsu-Scansnap mit Zufuhrfach), mit dem Seiten mit ~ 25 Seiten pro Minute (Seiten pro Minute) verarbeitet werden können. Wir sind jedoch besorgt, dass die Seiten zerrissen oder gefangen werden (und wir versuchen, die Originale nicht zu gefährden). . Es gibt auch die Frage nach den Heftklammern (die entfernt werden könnten ...). Wir könnten ein Flachbett machen, aber whoa, das ist eine riesige Arbeit, die manuell erledigt werden muss! Wir könnten das immer für die sehr großen Stücke tun.

Ich hoffe, dass Sie einige sehr kluge Ideen haben, wie Sie dies erreichen können ... Vielen Dank für Ihre Zeit und Hilfe 


BEARBEITEN Es scheint, dass ein kombinierter Ansatz ( Feinpapierscanner + vertikaler Kopierständer ) am besten funktioniert, um die erforderlichen Seiten / Minute sicherzustellen. Ein Offline-Vorschlag: Ein Kopierer? Was würden wir davon ausgehen, wenn wir die gesamte Sammlung zuerst einfach fotokopieren, dann entweder den Kopierer digital senden lassen oder die Fotokopie in einen Scanner kopieren. Es scheint mir eine Doppelarbeit zu sein, aber ich bin nicht mit dem Mut der Tech vertraut, um es besser zu wissen.

3
Es gibt Unternehmen, die Bücher sehr günstig scannen, sie können dies für Sie tun oder haben einige Ideen. Wenn sie ein Buch einscannen können, dann können sie vielleicht Ihre Sachen scannen oder Ihnen ein Feedback geben, wie Sie Ihre Sachen sicher scannen können. Sie könnten versuchen, sich mit Fujitsu in Verbindung zu setzen. Ich habe schon einen guten Kodak-Scanner gesehen, Sie würden nicht viel auf einmal einsetzen. Wie vielleicht 5 gleichzeitig und füttern Sie mehr manuell ein. Ich weiß nicht, wie es mit altem extra dünnem Papier oder ungeraden Formaten umgehen soll. ungerade Größen vielleicht nicht gut. barlop vor 7 Jahren 1
Anscheinend hat Panasonic KV-Serie eine "dünne Papierscanner" -Funktion, die ich auf einer Website erwähnt habe, und es wurde auf http://panasonic.net/pcc/products/scanner/kv-s1065c_1046c/features.html verlinkt. "Jetzt können Sie fortlaufend Scannen Sie Dokumente mit einer Dicke von bis zu 0,04 mm. Dies erleichtert das Scannen dünner Formulare oder Gutscheine und erhöht die Anzahl der Situationen, in denen Sie scannen können - ohne sich um dünnes Papier kümmern zu müssen. " <- so klingt es, als würde es dünnes Papier brauchen und ungleichmäßig groß sein. Man könnte auch panasonic nennen barlop vor 7 Jahren 1
http://www.scantastik.com/hardware/kodak/kodak-i2600-scanner.htm "Vielseitigkeit. Kleine oder große, dicke oder dünne ID-Karten, sogar geprägte Hard Cards - egal, was Sie scannen, Die Papierhandhabung von Kodak funktioniert durch. Das Ausgabefach kann leicht angepasst werden, um eine Vielzahl von Dokumenten aufnehmen zu können. " barlop vor 7 Jahren 1
Es gibt viele Arten von Unternehmen, die sich mit dieser Art von Arbeit beschäftigen. SiXandSeven8ths vor 7 Jahren 0
Ja, es gibt eine Reihe von Unternehmen. Die meisten verlangen einen Haufen Geld für so etwas. Ich denke, ihre Hauptabsicht ist es, in der Archivierung zu arbeiten (zum Beispiel auf Papier, auf dem Eisengallustinte durch die Seite gebrannt ist). Es ist wirklich cool und es gibt eine nette Quelle aus der Kongressbibliothek zu diesem Thema hier (https://loc.gov/preservation/care/scan.html). Gryph vor 7 Jahren 0
Ich sollte auch erwähnen, dass sie aus technischer Sicht nicht zu sehr darauf aus sind zu helfen, zumindest die, mit denen ich Kontakt aufgenommen habe. Ich könnte als List angesehen werden - um ihre IP zu bekommen! @ barlop, diese ** Scanner scheinen eine großartige Option zu sein. Ich könnte am Ende einen davon bekommen und auch den unten stehenden ** vertikalen Kopierständer einrichten. Gryph vor 7 Jahren 0
Wenn Sie die Scanner mitbringen, schlage ich vor, Scanner mit LED-Beleuchtung zu verwenden, da die alte CCFL auf der Durchreise beschädigt werden könnte, und dies ist ein Kopfschmerz, den Sie nicht benötigen. cybernard vor 7 Jahren 1
Wenn ** "Fehler ist keine Option" **, würde ich eine Menge Scanner kaufen, wie z. B. 10, denn wenn Sie etwas mit 300.600,1200 dpi scannen müssen, wird es viel langsamer. Dann werden Ihre Mitarbeiter weiterhin mit den anderen Scannern füttern. Selbst wenn einige nicht genutzt werden, haben die meisten Geschäfte ein Rückgaberecht von 30 Tagen. 130.000 / 10 Scanner = 13000pg ea. 20 ppm = 650 Minuten. Bei ungeraden Ballseiten wird der Prozess jedoch verlangsamt, und Sie werden sich später für die zusätzliche Zeit bedanken, die Sie budgetiert haben. cybernard vor 7 Jahren 0
@cybernard Nun, er hat ein Team von 6 Leuten, ich glaube nicht, dass sie sich um einen Scanner drängen werden. Aber manchmal kann man nicht so viele auf einmal einsetzen, man muss einige manuell füttern Andernfalls kann es zu Schluckauf kommen. Sie können die Höchstgeschwindigkeit des Scanners ermitteln (ich schätze, wenn Sie die Auflösung annehmen, also eine langsame Geschwindigkeit), aber wenn er 6 Personen hat, können sie> nicht gleichzeitig verwenden 6 Scanner {Wenn es der Fall ist, dass Sie manuell einen Stapel manuell zuführen müssen)? Es ist eine leichte Fertigkeit, die leicht zu entwickeln ist, wie die letzte, die hineingeht, neue einsetzt. Ich habe gesehen, dass es getan wurde ... barlop vor 7 Jahren 1
Ich habe es auf einem Kodak gemacht gesehen .. barlop vor 7 Jahren 0
@barlop Zuerst benötigst du mehr Scanner wegen möglicher Brüche. Zweitens kann eine Person 100 Blatt in Scanner 1 und 100 weitere in Scanner 2 einlegen. Wenn dies nachhaltig ist, bedeutet dies bei 25 ppm, dass diese beiden Scanner nun mindestens 4 Minuten lang beschäftigt sind. Es ist denkbar, dass Sie genügend Heftklammern entfernen, um genügend neue Dokumente für den Einzug eines dritten Scanners bereit zu haben. Auch die Geschwindigkeit von 25 ppm ist ein physikalisches Limit. Sie benötigen mehr Scanner. Wenn auch nur die geringste Chance besteht, mehr als einen Scanner zu verwenden, würde ich darauf springen. Ich hätte viel mehr, aber mindestens +3 für Dokumente mit unterschiedlichen Größen (hi dpi). cybernard vor 7 Jahren 1
Mein erster Einsatz bestand darin, mehrere Einzugsfachscanner zu haben, vielleicht sogar zwei pro Person, und ein oder zwei Läufer, die Dokumente packten und sie aushändigten. Aber die Möglichkeit von Papierschäden, Maschinenstillständen usw. Hat ein Teil des Teams den Eindruck, dass Flachbetten besser wären. Ich habe das Gefühl, dass dies ein Albtraum wäre (sogar 130.000 Mal auf "Scannen" klicken!). Gryph vor 7 Jahren 0
Mein aktueller Take (und die Antwort wird lauten, wenn ich nichts anderes sehe), werden mindestens einige der oben genannten ** Dünnpapierscanner ** und ein vertikaler Kopierstand für die ungeraden Formate sein oder besonders empfindlich. Dies ist abgesehen von der anderen Ausrüstung (Heftklammer, mehrere Festplatten (möglicherweise RAID), einige Desktops usw.). Gryph vor 7 Jahren 0
@cybernard sag nicht, dass ich es brauche, du verwirrst einfach die Leute, nicht ich frage die Frage. Der Begriff ist "jemand würde" oder man würde oder das OP würde. Ich habe auch einen Kodak-Scanner gesehen, der schnell und zuverlässig war, aber während er viele Laken einnimmt, frisst er 2 auf einmal, wenn Sie mehr als eine kleine Menge auf einmal einsetzen. Ich erinnere mich an einen Drucker, den HP Deskjet 895cxi, einen von HP hergestellten Vorzeige-Modelldrucker, der sehr gut sein sollte, und HP ist ein hervorragendes Gerät für Drucker, aber es würde mehr als ein Blatt gleichzeitig verarbeiten, es sei denn, es war nicht viel Papier eingespeist .. vielleicht auch mit Scanner zB meinem Beispiel. barlop vor 7 Jahren 0
Was ist mit dem Fotokopieren? Irgendwelche Gedanken dazu (siehe oben?) Gryph vor 7 Jahren 0

3 Antworten auf die Frage

6
Yorik

Wenn Sie nur Faksimiles benötigen und sich nicht so sehr für eine perfekte Präsentation interessieren, ziehen Sie eine Kamera in Betracht, die an einem vertikalen Kopierständer angebracht ist .

Garantiert nicht zu verklemmen, leicht an verschiedene Medien anzupassen, für OCR einigermaßen geeignet und weitaus schneller als ein Flachbett für Verbraucher.

Ein selbst gemachtes Bild kann ziemlich billig sein, und Sie können den Stapel einfach unter die Kamera legen, die Kamera so einstellen, dass der Rahmen maximal gefüllt ist, und dann mit dem Umblättern der Seiten beginnen und jeweils eine Aufnahme machen.

Der Autofokus sollte alle Tiefenänderungen verarbeiten, und Sie müssten niemals die Heftklammern / Ordner / etc entfernen.

Vielleicht billig genug, können Sie alle 6 Personen mit Kameras arbeiten lassen.

Zwei Dinge zu beachten:

Eine Seite mit 8,5 x 11 @ @ 150 ppi, die mit zufälligem Rauschen gefüllt ist, wird rgb um 1 MB jpg komprimiert sein, sodass Sie mindestens 200 GB freien Speicherplatz benötigen.

130.000 / 6 Personen / 10 Tage / 8 Stunden pro Tag / 60 Minuten pro Stunde = 5 Scans pro Minute. Ich denke, das ist für eine Kamera machbar, aber kein Flachbett-Scanner für Endverbraucher.

Wahrscheinlich wird jede Kamera mit 8 Megapixel oder mehr funktionieren. Yorik vor 7 Jahren 1
Jetzt reden wir! Nicht sicher, ob Sie wissen, dass dies tatsächlich dem Ansatz von Google zum Scannen von Büchern (zumindest in der Form) sehr ähnlich ist. Hier ist ein NPR-Artikel über [das] (http://www.npr.org/sections/library/2009/04) /the_granting_of_patent_7508978.html). Ich bin mir noch nicht sicher, aber ich frage mich, ob dieser Ansatz (für die schwierigsten oder großformatigen Teile) plus ein oder zwei Hochleistungsscanner die beste Balance zwischen Geschwindigkeit und Effizienz darstellt (wie der Text dies erfordert.) OCR ** -Verarbeitung). Gryph vor 7 Jahren 0
Ich benutze jetzt eine Kamera für alles. Ich benutze sogar eine DSLR-Kamera und einen Lichttisch als Hintergrundbeleuchtung für die Aufnahme von 4x5- und 8x10-Folien. Yorik vor 7 Jahren 0
Ein wirklich großer Artikel mit Text, den Sie zur OCR senden möchten, muss wahrscheinlich zusammengefügt werden. Andernfalls fällt die Textgröße unter die angemessene Größe. Wahrscheinlich möchten Sie bei der Aufnahme ein Minimum von 150 ppi. Glücklicherweise können Sie Ihren gesamten Workflow per SMS versenden, bevor Sie dorthin gelangen. Die OCR kann bis nach dem Scanfenster warten, solange Sie testen und sicherstellen, dass Sie gute Daten erfassen. Yorik vor 7 Jahren 0
Eine Option, die Ergebnisse von geringerer Qualität liefert, jedoch erheblich weniger Setup erfordert, besteht darin, alle Benutzer eines Smartphones mit einer Scan-App auszustatten. Ich verwende [Office Lens] (https://blogs.office.com/2013/03/17/office-lens-a-onenote-scanner-for-your-pocket/) unter Windows Phone, um PDFs mit durchsuchbarem OCR-Text zu erstellen Ich bin mir ziemlich sicher, dass es auf Android und iPhone gute Äquivalente gibt, wie zum Beispiel CamScanner Micah Lindström vor 7 Jahren 0
@ MicahLindström: Ich stimme zu. Zwei Dinge, die eine DSLR-Einrichtung auf einem Gerüst hat, könnten für diese bestimmte Aufgabe zu ihren Gunsten wirken: (1) ein Fernumschaltkabel, damit der Bediener mit einer Hand die Seiten umblättern und mit der anderen Taste die Taste loslassen kann. Dies ist eher eine Überlegung zur Geschwindigkeit; (2) Da sich die Kamera niemals bewegt, muss die Bildkomposition nur einmal pro Stapel ausgeführt werden (also schneller). Der zweite kann immer noch mit einem Smartphone erreicht werden, indem Gummibänder usw. verwendet werden, um die Kamera an einer Armatur zu befestigen Yorik vor 7 Jahren 0
Hat jemand in dieser Antwort die Verwendung eines Kopierers in Betracht gezogen? Ich bin der Idee müde, weil die Qualität nachlässt, aber ich sehe den Vorteil des konsistenten Ausgabeformats. Es tut uns leid, ähnliche Kommentare erneut zu posten. Ich bin mir nicht sicher, ob die Threads die Nachrichten zwischen den Antworten beibehalten würden. Gryph vor 7 Jahren 0
Mir ist gerade aufgefallen, dass Adobe Acrobat DC ([Miete für 25 $ / Monat] (https://acrobat.adobe.com/us/en/acrobat/pricing.html)) JPEGs in PDF-Dateien verarbeiten kann, einschließlich Seitenrahmen und automatischem Zuschneiden von Seiten OCR. Siehe Video "JPEG in PDF zur Archivierung konvertieren" (https://acrobat.adobe.com/us/en/acrobat/how-to/convert-jpeg-tiff-scan-to-pdf.html) und [auch this] (https://helpx.adobe.com/acrobat/using/enhance-camera-images.html). Wenn Sie dann den [Aktionsassistenten] (https://helpx.adobe.com/acrobat/using/action-wizard-acrobat-pro.html) verwenden, könnten Sie all diese Bilder wahrscheinlich sehr schnell weiterverarbeiten. Micah Lindström vor 7 Jahren 0
4
Gustav Eriksson

Ich kann nicht beantworten, welchen Scanner ich bekomme, aber ich kann aus Erfahrung als ehemaliger Mitarbeiter sprechen, der Dokumente aller Formen und Formate vorbereitete, scannte und archivierte, deren Papier selten brüchig ist und Tränen in der digitalen Kopie nur schwer zu erkennen sind.

Heftklammern sind ein schwieriger Umgang, je nachdem, wie wichtig die Ecken sind. Wenn es wichtig ist, nicht beschädigt zu werden, kann es 4-15 Sekunden dauern, bis eine davon entfernt wird, je nachdem, wie hartnäckig sie sind. Einige explodieren auch gerne. Decken Sie die Klammer bitte mit der Hand ab, um Augenschäden zu vermeiden.
Es gibt zwei verschiedene Arten von Werkzeugen zum Entfernen von Heftklammern, eines mit Metallzähnen und eines, das nur eine Art Stift ist, den Sie unter die Heftklammer schieben und dann weiter gleiten, bis die Heftklammer heraus ist.
Der gezahnte ist viel langsamer, reißt jedoch selten das Papier und der gleitende ist schnell, reißt jedoch eher die Ecke.

Ein erfahrenes Team würde 130.000 Papiere von 150-225 Arbeitsstunden abwickeln, ein unerfahrenes Team könnte doppelt so groß sein, je nachdem, wie die Papiermenge abgewickelt werden musste. Wichtig ist jedoch, dass der Scanner immer aktiv bleibt.

Der Ratschlag, den ich zum Scanner und zum Scannen geben würde, ist, dass es sehr wichtig ist, die Arbeitslast der Person, die scannt, auf effiziente Weise zur Verfügung zu stellen. Sammeln Sie die Papiere und führen Sie sie zusammen mit einigen Trennzeichen zwischen den verschiedenen Dokumenten aus. Teilen Sie die Dokumente im Posteingang, wenn der Scanner es nicht live ausführen kann.
Sie brauchen wirklich einen "Papierrüttler", um zu vermeiden, dass Papiere die Orientierung in der Maschine beeinträchtigen. WAAYY schnellere und bessere Ergebnisse als ein Mensch die Papiere schüttelt. Aber ich habe nur Erfahrung mit einer Maschine, daher weiß ich nicht, wie man ein Gut von einem Schlechten unterscheidet, ohne es zu benutzen (wenn es schlechte gibt).
Es ist wichtiger, einen Scanner zu haben, der einfach zu laden ist, als eine hohe PPM-Rate (alles ist relativ). Wenn Sie einen 25ppm-Scanner nicht mit 25ppm laden können, erhalten Sie nicht wirklich 25ppm Arbeit. Sie möchten wirklich hunderte von Papieren gleichzeitig einlegen, um die Maschine am Laufen zu halten.

Wenn es noch mehr Dinge gibt, über die Sie sich wundern, werde ich versuchen, auch diese zu beantworten.

Dies ist ein guter Ratschlag - haben Sie Erfahrung mit dem Scannen von fragilem Papier (denken Sie an Quittungen von vor 20 Jahren, dünnes Papier). Ich sehe einige Optionen darüber, die funktionieren könnten, aber ich dachte, ich möchte zuerst direkt fragen. Der ** Papierrüttler ** scheint eine gute Idee zu sein, obwohl ich beim ** Preis ** (ca. 2K) etwas deprimiert war. Ich werde eine ** Vermietung ** Option dafür suchen. Gryph vor 7 Jahren 0
@Gryph Ich habe mich nicht mit alten Quittungen befasst, aber ab und zu haben wir Papier in Telefonbuchqualität erhalten, und es gibt nichts Besonderes. Wenn es kleine Quittungen gab, klebten wir sie auf ein Standardpapier und liefen dies durch den Scanner. Wenn das kleine Papier Informationen auf der Rückseite enthielt, kopierten wir zuerst das Papier und klebten dann das Original mit der anderen Seite auf die Kopie. Gustav Eriksson vor 7 Jahren 0
Das ist großartig zu wissen. Ich bin sehr besorgt über diesen Aspekt. Haben Sie jemals darüber nachgedacht, die Arbeit nur zu kopieren und sich dann mit den Kopien zu beschäftigen? Mein Bauch sagt, dass die Doppelarbeit und der Qualitätsverlust Kopfschmerzen verursachen würden, aber ich kann verstehen, warum es Anziehungskraft gibt - das ausgegebene Format wäre konsistent, und wir könnten jedes Exemplar in unserer Freizeit lange einscannen. Gryph vor 7 Jahren 0
@Gryph Ich bin nicht ganz sicher, ob ich deinem Gedankengang folge. Die meisten der Zeitungen (fast alle) waren rechtlich wichtig für die Aufbewahrung (der Originale), obwohl wir die Originale meistens abrufen mussten, weil sie irgendwohin verschickt werden sollten (Fehler des Senders in 95% der Fälle). Günstige persönliche Kopierer und sogar Fotos von Handys liefern mehr Details, als Sie mit Ihren Augen sehen können. Ich glaube nicht, dass Qualität ein Problem sein wird. Sie können immer den Ausdruck einer Kopie in Farbe erkennen, der Text in Schwarz oder Weiß wirkt jedoch immer scharf. Gustav Eriksson vor 7 Jahren 0
4
user291737

Ein paar Gedanken zum Entfernen von Heftklammern

Bei Standard-Dokumentenscannern müssen Sie Heftklammern entfernen.

Wenn die Papierkante neben der Heftklammer keine Informationen enthält, können Sie in Betracht ziehen, die Kante zusammen mit der Heftklammer abzuschneiden . Der einfachste und schnellste Weg ist, einen Papierschneider mit Hebel zu verwenden . Rotationspapierschneider sind für diesen Zweck weniger ergonomisch und langsamer. Wenn Sie zu diesem Zweck eine Schere verwenden, werden Sie mit Ihrer Menge an gehefteten Dokumenten schnell schmerzende Finger bekommen, insbesondere wenn Sie dickere geheftete Dokumente haben.

Wenn Sie die Kanten beibehalten möchten, haben Sie die Wahl zwischen zahlreichen verschiedenen Formen von Heftklammerentfernern . Um hunderte von Klammern zu entfernen, bietet ein zangenförmiger Klammerentferner wahrscheinlich die beste Ergonomie und ist für Papiervorlagen am sichersten. Der Vorteil ist, dass es einen Hebel hat, so dass Sie weniger Kraft benötigen. Klauenförmige Entferner haben keinen Hebel. Infolgedessen benötigen Sie viel mehr Kraft und bekommen bald einen Krampf in der Hand und Muskelkater im Arm. Gleiches gilt für zungenförmige Klammerentferner. Das Risiko, das Papier mit kieferförmigen Papieren zu beschädigen, ist sehr hoch, die Zungenform etwas geringer. Bei klauenförmigen Formen müssen Sie häufig von beiden Seiten des Papierstapels unter die Heftklammer "beißen", insbesondere wenn der Papierstapel dicker und die Heftklammer lang ist. In diesem Fall dauert es lange, bis Sie die Heftklammer herausgeholt haben.

Mit einem zangenförmigen Klammerentferner reicht oft ein "Biss" von der Oberseite des Papierstapels aus, um die Klammer auf einmal zu entfernen. Mit dem von mir verwendeten Entferner ( Skrebba skre-klick ) ist das Risiko eines Papierschadens ebenso gering wie die erforderliche Kraft. Es könnte aber auch andere geben, die so gut sind. Mit einem solchen Heftklammerentferner sind Sie leicht doppelt so schnell wie mit den beiden anderen genannten und Sie beschädigen das Papier selten .

Beispiele für oben erwähnte Klammerentferner:

"Zangenförmig"

"Jaw-förmig"

"Zungenförmig"