Neue Fragen mit dem Tag «tesseract-ocr»

Insgesamt gefunden 31 Frage

Bewertungen

Antworten

459

Ansichten

Fehler beim Training von Tesseract mit jTessBoxEditor

Ich habe etwa 50 Bilder in eine TIF-Datei mit jTessBoxEditor (Linux) zusammengeführt, aber wenn ich versuche, die .box-Datei mit diesem Code zu erhalten: tesseract mjchar.tif mjchar -l eng --psm 10 batch.nochop makebox ein Fehler ist aufgetreten: Tesseract Open Source OCR Engine v4.0.0-beta.1 mit...

ocr tesseract-ocr

fragte J.C.Liu vor 5 Jahren

Bewertungen

Antworten

409

Ansichten

Tesseract OCR: Wie zeige ich alle möglichen Antworten für ein Bild?

Ich arbeite daran, Tesseract zu verwenden, um alte Schriften zu finden. Tesseract als Werkzeug zeigt nur eine Antwort (Ausgabe) für ein Bild, und manchmal ist die Ausgabe falsch. Ich möchte in der Lage sein, alle möglichen Vorhersagen (Antworten) für jedes Bild zu sehen und eine von ihnen zu wählen,...

tesseract-ocr

fragte agent2247 vor 6 Jahren

Bewertungen

Antwort

555

Ansichten

Wie kann ich Tesseract OCR für eine Chrome-Erweiterung hosten?

Derzeit arbeite ich am Entwurf einer Google Chrome-Erweiterung, die ein Bild aufnimmt. Dieses Bild setzt voraus, dass es mit dem Befehl (cmd) an Tesseract OCR übergeben wird und die Ausgabe als Text abruft. Ein Textbereich in der Erweiterung zeigt das Ergebnis. Ich weiß nicht, wo ich mit dem Hosting...

google-chrome-extensions hosting tesseract-ocr

fragte user6512156 vor 6 Jahren

Bewertungen

Antworten

479

Ansichten

Tesseract 4.0 liest keine Bilder mit nur einem Text

Ich verwende Tesseract v4.0.0-beta.1-108-gf291 Das Bild 5.jpg wird nicht gelesen (ein Wort: Zeichen mit guter Größe) tesseract 5.jpg out.txt Ich habe alle möglichen --psm-Optionen ausprobiert nicht gelesen Das Bild (50.jpg) wird aber wirklich gut gelesen… Was ist hier los? Ein Wort wird nicht gelese...

microsoft-word tesseract-ocr

fragte YounesCHTIOUI vor 6 Jahren

Bewertungen

Antworten

676

Ansichten

Können Untertitel von dvdsub über die Befehlszeile in srt konvertiert werden?

Gibt es eine Möglichkeit, dvdsub (bildbasierte) Untertitel in srt zu konvertieren? zum beispiel mit mencoder oder ffmpeg kombiniert mit tesseract? Ich suche etwas Kommandozeilenbasiertes, und ich bin in Ordnung mit ein paar Pässen gehen zu müssen. Ich bin weniger an GUI-basierten Tools interessiert.

ffmpeg mencoder tesseract-ocr

fragte simone vor 7 Jahren

Bewertungen

Antworten

817

Ansichten

So erkennen Sie die Textsprache in einem Foto automatisch und übersetzen es

Es ist mir gelungen, eine OCR-App zu integrieren, um Text aus einem Foto ( https://obserbot.com/) zu erkennen, es wird jedoch nur exakter Text aus dem Foto abgerufen und nicht mehrsprachig konvertiert. Ich möchte, dass die App die Textsprache erkennt und automatisch in die Sprache des Lesers überset...

ocr tesseract-ocr

fragte Abdullah Hussain vor 7 Jahren

Bewertungen

Antworten

553

Ansichten

Wie trainiere ich Tesseract, um die Wellenlinien zu ignorieren, die durch die Erkennung von Rechtschreib- und Grammatikfehlern hinzugefügt wurden?

Ich verwende Tesseract zum Erkennen von Text in einer Vielzahl von Bildtypen, einschließlich Screenshots. Verwirrt werden die gewellten roten und blauen Unterstreichungen für Rechtschreib- und Grammatikwarnungen, wie im folgenden Beispiel. Am Ende bekomme ich entweder keinen Text oder ein Durcheinan...

imagemagick tesseract-ocr

fragte GdD vor 7 Jahren

Bewertungen

Antwort

1290

Ansichten

Optimale Schrift für Tesseract? (speziell der .NET-Wrapper)

Ich verwende Tesseract, um gedruckte Textdokumente, die mit meiner Handykamera aufgenommen wurden, in Text umzuwandeln. Die Ergebnisse sind nicht so toll. Die Qualität des Bildes ist sehr gut, viel klarer als ein Fax, aber es scheint sehr schwierig zu sein, Zeichen zu identifizieren. Ich habe auch v...

tesseract-ocr

fragte user613051 vor 8 Jahren

Bewertungen

Antworten

714

Ansichten

Lustige OCR-Situation

Ich habe eine mehrseitig gescannte 300-dpi-PDF-Datei auf einem Ubuntu 16.04-System. Wenn ich den folgenden Befehl ausführen: pdfocr -t -l swe -i *.pdf -o newfile.pdf Es ergibt sich eine perfekt lesbare OCR-Datei. Jedes einzelne Wort ist in jeder Größe und Form der Schriftarten durchsuchbar. Der näc...

pdf ocr ghostscript tesseract-ocr

fragte Paul Bergström vor 8 Jahren

Bewertungen

Antworten

1259

Ansichten

Wie komprimiere ich Tesseract-kodierte PDFs, während der eingebettete Text von OCR erhalten bleibt?

Ich habe mit Tesseract experimentiert, um meine PDFs zu OCR zu machen, und es war meistens erfolgreich, insbesondere mit deutschen Fraktur-Texten (dem alten gotischen Druck), die Tools wie Adobe Acrobat nicht richtig erkennen können. Das Problem ist, dass die Ausgabedateien von Tesseract ziemlich g...

pdf compression adobe-acrobat ocr tesseract-ocr

fragte Jason vor 8 Jahren

Bewertungen

Antwort

1243

Ansichten

Wie extrahiere ich Unicode-Zeichen aus der .png-Datei?

Ich möchte Unicode-Zeichen aus JPG- und PNG-Dateien extrahieren. Ich versuche es mit folgendem Befehl: tesseract 1.png output.txt Dieser Befehl funktioniert für englische Zeichen, aber wenn ich es für Unicode wie Hindi, Marathi oder Devanagari Script versuche, führt dies zu einer falschen Ausgabe....

ocr tesseract-ocr

fragte Madhav Nikam vor 8 Jahren

Bewertungen

Antwort

1605

Ansichten

Wie kann OCR dieses Bild erkennen?

Original Bild Ich denke, die Ziffern aus diesem Bild zu erkennen, wäre wirklich einfach, aber es ist einfach nicht an Tesseract und viel Online-OCR zu erkennen. Dann verarbeite ich es so. Prozessabbild Leider kann es vom Tesserakt noch nicht erkannt werden. Mein Tesseract-Parameter: tesseract inpu...

ocr tesseract-ocr

fragte too lazy to log in vor 8 Jahren

Bewertungen

Antwort

1101

Ansicht

In jTessBoxEditor for Tesseract wird das Kombinieren mehrerer TIFF / Box-Dateien in einer trainierten Datendatei beschrieben

Ich denke, dass dies mit der Befehlszeile möglich wäre, aber wie es mit jTessBoxEditor zu tun ist, da dies einen großen Workflow automatisieren würde. Da jTessBox mehrseitige TIFF-Dateien unterstützt, denke ich, dass dies der Fall sein könnte, aber wie organisiere ich in diesem Fall Boxdateien?

ocr tesseract-ocr

fragte coldbreeze16 vor 8 Jahren

Bewertungen

Antworten

438

Ansichten

Tesseract unter Windows: Die Ausgaben sind immer unschädlich

Also versuche ich dieses Bild zu OCR: (Dies sind eigentlich Benutzernamen) Verwenden Sie diesen Befehl an der Windows-Eingabeaufforderung: tesseract screenshot.png out Die out.txt-Datei bringt jedoch immer unschöne Ergebnisse. In diesem Fall ist es: belsahx Was mache ich falsch? Ist es der weiße...

tesseract-ocr

fragte yasuo vor 9 Jahren

Bewertungen

Antwort

997

Ansichten

Wie kann man mit dem OCR-Tool pdfsandwich verzerrte Ergebnisse vermeiden?

In der Regel müssen gescannte Seiten vor dem Anwenden eines OCR-Tools schräggestellt werden. Hier ist meine Eingabe eine gerade gescannte Seite, und der OCR-Ausgang ist manchmal im oder gegen den Uhrzeigersinn schief. In meinem Anwendungsfall eines 260-seitigen englischen Buches geschieht dies für 1...

pdf scanning ocr tesseract-ocr

fragte lalebarde vor 9 Jahren

Bewertungen

Antworten

751

Ansicht

Deaktivieren Sie das Wörterbuch in Tess4J

Die Genauigkeit der Zeichenerkennung in meiner tess4j OCR-Anwendung ist sehr gering. Ich habe gehört, dass das Deaktivieren des Wörterbuchs in tess4j die Genauigkeit erhöht, indem einzelne Zeichen erkannt werden. Aber ich weiß nicht, wie es geht. Weiß jemand, wie man das Wörterbuch in tess4j ausscha...

java ocr tesseract-ocr

fragte Chalaka Ellawala vor 10 Jahren

Bewertungen

Antwort

3982

Ansichten

Verwenden Sie ffmpeg für die Umwandlung von JPEG in TIFF

Ich möchte Tesseract OCR mit einem Video verwenden. Mit ffmpeg kann ich einige ( .jpeg) Bilder aus einem Video exportieren . Kann ich mit ffmpeg ein .jpegin ein gültiges konvertieren .tiffoder .tiffBilder direkt aus dem Video exportieren ?

ffmpeg jpeg tiff image-conversion tesseract-ocr

fragte Tenaciousd93 vor 10 Jahren

Bewertungen

Antworten

1851

Ansicht

Tesseract auf Linux

So lösen Sie das Problem, ohne dass bei einer Warnung tesseract 3.03 installiert werden muss: Warnung: Sie führen eine nicht unterstützte Version von Tesseract aus. In Erwartung von Version 3.03 ist Ihre Version: 3.02.02 Fehler beim Öffnen der Datendatei /usr/local/share/tessdata/lus.traineddata St...

linux tesseract-ocr

fragte Rogerrubens vor 10 Jahren

Bewertungen

Antworten

3443

Ansichten

Tesseract konnte keine Sprachen laden

Beim Ausführen des tesseract makeboxBefehls wurde der folgende Fehler ausgegeben Error opening data file /opt/local/share/tessdata/eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Failed loading language 'eng' Tess...

macos homebrew ghostscript tesseract-ocr tif

fragte Nina vor 10 Jahren

Bewertungen

Antwort

4523

Ansichten

Tesseract OCR: Nicht unterstützter Bildtyp

Ich habe die PDF-Datei in die TIF-Datei mit den folgenden Befehlen auf dem Terminal konvertiert convert -density 300 -depth 4 lang.font-name.exp0.pdf lang.font-name.exp0.tif convert lang.font-name.exp0.tif -colorspace rgb -type truecolor lang.font-name.exp0.tif Dann versuchte ich, den makeboxBefehl...

macos macports homebrew tesseract-ocr

fragte Nina vor 10 Jahren

Bewertungen

Antworten

5882

Ansichten

Tesseract 3.03 englischsprachige Daten

Tesseract 3.03 wurde kürzlich veröffentlicht und ich habe es gerade installiert. Englischsprachige Daten werden jedoch nicht mit dem Download bereitgestellt (von https://launchpad.net/ubuntu/+source/tesseract/3.03.03-1 ). Auf der Tesseract-Website gibt es einen "Download" -Link, aber Sie können nur...

tesseract-ocr

fragte MarAja vor 10 Jahren

Bewertungen

Antwort

4982

Ansichten

OCR mit nichtsprachlichem Text

Ich bin daran interessiert, OCR zu verwenden, um Text aus einem Dokument zu erkennen, das keine Wörter enthält. Es handelt sich vielmehr um ein Dokument mit einer langen Folge von "zufälligen" gedruckten Zeichen. Ich habe versucht, Tesseract zum Scannen des Textes zu verwenden, aber es scheint nach...

ocr tesseract-ocr

fragte Daniel vor 11 Jahren

Bewertungen

Antwort

2053

Ansichten

Tesseract hocr und txt gleichzeitig oder Konvertierung von Tesseracts hocr in txt

Ich habe mit Linux OCR-Software herumgespielt und mag Tesseract sehr, besonders in Verbindung mit gsan2pdf. Tesseract v3 oder höher unterstützt die Ausgabe im hocr-Format, und gscan2pdf kann dies nutzen, um durchsuchbare PDFs gescannter Dokumente zu erstellen. Manchmal möchte ich jedoch auch die Nur...

linux pdf tesseract-ocr

fragte PSkocik vor 11 Jahren

Bewertungen

Antworten

2367

Ansichten

GIFs können nicht mit Tesseract in OSX verarbeitet werden

Folgende Fehlermeldung wird angezeigt: Tesseract Open Source OCR Engine v3.02.02 with Leptonica Error in pixReadStreamGif: function not present Error in pixReadStream: gif: no pix returned Error in pixRead: pix not read Unsupported image type. Irgendwelche Ideen warum?

macos mac gif tesseract-ocr

fragte Sherzod vor 11 Jahren

Bewertungen

Antwort

1565

Ansichten

TesseractOCR individuelle Schulung

Ich verstehe es nicht, wie soll ich Tesseract sagen, dass es sich tatsächlich um a b cBuchstaben handelt? Anhängen von makebox in cli erzeugte diese Datei: C 78 127 104 166 0 l 96 127 118 166 0 . 116 127 126 140 0 - 124 127 130 145 0 j 145 127 162 188 0 o 154 127 183 158 0 b 203 131 241 164 0

tesseract-ocr

fragte Jim vor 11 Jahren

Bewertungen

Antworten

14625

Ansichten

OCR-Tesseract, leerer Seitenfehler?

Ich habe es aus Quellen mit zusammengestellt leptonica. Dies ist ein PNG-Bild mit transparentem Hintergrund, das ich bearbeitet habe, indem ich eine blaue Farbe hinzugefügt habe und immer noch diesen Fehler: Tesseract Open Source OCR Engine v3.02.02 with Leptonica Empty page!! Empty page!! Hier ist...

ocr tesseract-ocr

fragte Jim vor 11 Jahren

Bewertungen

Antworten

620

Ansichten

Tesseract kann nicht scannen: Fehler: Nur 1,2,4,5,6,8 bpp werden unterstützt: 32`

Obwohl ich das tat, convert canvas.png -depth 8 canvas.tifsehe ich immer noch diese Fehlermeldung: Tesseract Open Source OCR Engine check_legal_image_size:Error:Only 1,2,4,5,6,8 bpp are supported:32 Segmentation fault Kann mir jemand erklären warum?

conversion ocr tesseract-ocr

fragte Jim vor 11 Jahren

Bewertungen

Antwort

520

Ansichten

Die gImageReader-Zwischenablage funktioniert nicht unter Windows

Ich verwende gImageReader, um OCR unter Windows 7 auszuführen, und obwohl ich aus der Anwendung selbst kopieren kann, kann ich nicht in die externe Windows 7-Zwischenablage kopieren. Ich glaube, das Programm basiert auf gtk, und möglicherweise muss eine Einstellung in gtk geändert werden, um diese F...

clipboard ocr gtk tesseract-ocr

fragte leeand00 vor 11 Jahren

Bewertungen

Antworten

6601

Ansicht

Installieren Sie Tesseract OCR 3 unter OSX

Ich versuche, Tesseract OCR unter OSX 10.6 zu installieren ... Ich bin so weit gekommen, Leptonic (durch Herunterladen von src und Installieren mit ./configure; make; sudo make install) scheinbar ohne Probleme zu installieren - aber ich weiß nicht, wie ich das überprüfen soll. Ich habe auch Tesserac...

macos installation ocr tesseract-ocr

fragte Billy Moon vor 13 Jahren

Bewertungen

Antwort

3071

Ansicht

Tesseract-OCR für englische Schriftarten trainieren

Ich habe etwa 3000 kleine Bilder von einzelnen Wörtern, die ich in Text umwandeln möchte. Ich habe Tesseract auf meinem Windows 7-Computer mit dem Installationsprogramm installiert und konnte OCR-Images über Cmd und Powershell erfolgreich verwalten. tesseract.exe imagename.png imagename erzeugt ei...

ocr tesseract-ocr

fragte andrew vor 13 Jahren