scannen A4 doc> pdf> ocr> ins Englische übersetzen?

4196
adolf garlic

Ich habe es mit einer Kombination aus versucht

  • Mein Home-Scanner zum Erstellen von "300 dpi", "Dokument", "PDF" (Optionen für Canon All-in-One)
  • ZoHoViewer zum Erstellen einer RTF- oder TXT-Datei
  • Google-Dokumente zum Übersetzen

Ich bin mir nicht sicher, wie gut oder schlecht ein Produkt ZoHoViewer ist, aber das Folgende:

Als Arbeitsmarkbehörde haben wir den gesetzlichen Auftrag, die Vermittelbarkeit von

verwandelt sich in:

AlsArbeitsmarktbeh6rde habenwirdengesetzlichenAuftrag, dieVermittelbarkeit von St ...

folglich macht goog docs das Frühstück eines Schweins, indem er versucht, es zu übersetzen.

Hat jemand bessere Vorschläge (vorzugsweise kostenlose Online-Dienste)?

2
Da es kein "genaues" Duplikat gibt, lasse ich dieses offen. Sie sollten jedoch die Fragen, die ich verlinkt habe, durchgehen, da diese möglicherweise Lösungsmöglichkeiten bieten Ivo Flipse vor 14 Jahren 0
Für den Fall, dass jemand interessiert ist, sollte die Übersetzung lauten: "Wenn es um die Arbeitsmarktbehörde geht, haben wir ein gesetzliches Mandat, die Beschäftigungsfähigkeit von" - oder etwas in dieser Richtung ChrisF vor 14 Jahren 0
Korrektur: "Wie die Arbeitsmarktbehörde" ... klingt besser :) vor 14 Jahren 0
@Molly - Es war nur eine Kopie 'n' Einfügen in Google Translate! ChrisF vor 14 Jahren 0

3 Antworten auf die Frage

5
Ivo Flipse

Es gab einige andere Fragen zu SuperUser zu OCR, die sich lohnen sollten, um nach möglichen Lösungen Ausschau zu halten.

Vor allem diese Antwort von Molly sieht vielversprechend aus:

Ich mag TopOCR wirklich, sicherlich eine großartige Ergänzung zu Ihren Scan-Tools:

  • Unglaubliche OCR-Genauigkeit von bis zu 99,8% bei einer 3-MP-Kamera
  • Keine Seitenbeschränkungen und keine zusätzlichen Downloads oder Komponenten erforderlich
  • Verarbeitet Bilder mit gemischtem Text und Grafiken (manuell oder automatisches Zoning)
  • Toleriert Schräglage und ungleichmäßige Beleuchtung
  • Mehrere Textausgabeformate, einschließlich durchsuchbarer PDF- und HTML-Dateien
  • Kann 11 verschiedene Sprachen lesen
  • Leistungsstarke, einfach zu verwendende Bildverarbeitung mit Image Dewarping
  • Unterstützt Smartphones: Einige Smartphone-Beispiele
  • Enthält integrierte, voll ausgestattete WYSIWYG-Editoren für Text und Bild
  • Rechtschreibprüfung für die Nachbearbeitung für alle 11 Sprachen
  • Integrierte Text-To-Speech-Software. Wie wäre es mit OCR in MP3?
  • Enthält einen integrierten mehrsprachigen Textübersetzer
  • Unterstützt eine Befehlszeilenschnittstelle und eine GUI
  • Erstellen Sie ein Such- und Indizierungssystem für Hochleistungsdokumente
  • Der Browser Helper-Modus unterstützt die Erstellung kostenloser Audio-eBooks
  • Mit der Web Engine von TopOCR können Sie ganz einfach neue Funktionen hinzufügen

alt text

Es ist sehr genau und funktioniert ausgezeichnet mit Bildern geringer Qualität, z. B. Fotos von Seiten / Dokumenten

TopOCR ist Freeware (kann mit Universal Extractor portiert werden )

Lesen Sie weiter:

Welche OCR-Software hat die meisten Optionen?

Praktische OCR-Lösung zum Konvertieren eines großen Buches in ein digitales Format?

Wie extrahiere ich Text mit OCR aus einem PDF unter Linux?

Dieses "Downvoting-Geschäft" hier wird lächerlich. Tatsächlich ist TopOCR ideal für diesen Job, da es Deutsch (und viele andere Sprachen) "versteht" und einen Übersetzer umfasst. +1 und für die Aufmerksamkeit des Moderators markiert. vor 14 Jahren 0
2 rauf, 2 runter: / Sathya vor 14 Jahren 0
Sieht gut aus, aber ich möchte meine Kamera nicht wirklich herausziehen müssen, wenn ich ein Dokument scannen möchte. Ich kann sehen, wie das schön sein kann, wenn Sie keinen Scanner haben oder mit Ihrem Telefon unterwegs sind. adolf garlic vor 14 Jahren 0
Das bedeutet, dass Sie dies auch für gescannte Dokumente tun können ;-) Ivo Flipse vor 14 Jahren 0
Ok, ich werde es versuchen. adolf garlic vor 14 Jahren 0
Ich habe topOCR mit einem anderen Dokument ausprobiert und es ist unbrauchbar. Tildas und so etwas überall [dies war von einem Dokument, das mit 600 dpi gescannt wurde]. Ich mache auch den Schmerz des Wechselns von Windows zu Mac und Topocr ist nur Fenster. adolf garlic vor 14 Jahren 0
4
ChrisF

Da die OCR konvertiert hat:

Als Arbeitsmarkbehörde ...

zu:

AlsArbeitsmarktbeh6rde ...

Ein paar Dinge fallen mir ein.

  1. Versuchen Sie, mit einer höheren Auflösung zu scannen. Es sieht so aus, als könnte es den Abstand zwischen den Wörtern nicht erkennen, eine höhere dpi könnte dies verbessern.

  2. Können Sie die Sprache Ihres OCR-Programms einstellen? Ich sehe, dass es das "ö" in eine "6" umgewandelt hat. Während dies ein Problem sein könnte, das durch die Lösung verursacht wird, könnte es auch sein, dass "ö" kein alltäglicher Bestandteil des Englischen ist. Das Programm wählt die "nächstbeste" Anpassung - in diesem Fall "6".

Gute Punkte, Chris! Ivo Flipse vor 14 Jahren 0
Wurde mit 600 dpi erneut gescannt, warte nur (für immer) darauf, dass zamzar mir das konvertierte Dokument schickt ... Ich denke, wenn es kostenlos ist, können Sie nicht zu viel erwarten, aber fast einen Tag !? Zu lang adolf garlic vor 14 Jahren 0
Jetzt habe ich nur überprüft und es ist die Konvertierung abgelaufen. Wieder anfangen. Harumph. adolf garlic vor 14 Jahren 0
Naah. zamzar ist unbrauchbar beim Erkennen von Leerzeichen selbst bei 600 dpi, wird ein anderes Konvertierungswerkzeug ausprobieren. adolf garlic vor 14 Jahren 0
0
adolf garlic

Nicht 100% perfekt, aber das Beste aus all den Dingen, die ich ausprobiert habe:

http://www.paperfile.net/ kombiniert mit einem Sprachpaket (Anweisungen zum kostenlosen Herunterladen in der App) Kopieren Sie den gesamten Text in ein Google-Dokument und fügen Sie ihn in ein Google-Dokument ein. Verwenden Sie dann die Werkzeuge> Übersetzen in Google-Dokumente