Neue Fragen mit dem Tag «tesseract-ocr»

Insgesamt gefunden 31 Frage

0
Bewertungen
0
Antworten
418
Ansichten

Fehler beim Training von Tesseract mit jTessBoxEditor

Ich habe etwa 50 Bilder in eine TIF-Datei mit jTessBoxEditor (Linux) zusammengeführt, aber wenn ich versuche, die .box-Datei mit diesem Code zu erhalten: tesseract mjchar.tif mjchar -l eng --psm 10 batch.nochop makebox ein Fehler ist aufgetreten: Tesseract Open Source OCR Engine v4.0.0-beta.1 mit...
fragte J.C.Liu vor 5 Jahren

0
Bewertungen
0
Antworten
376
Ansichten

Tesseract OCR: Wie zeige ich alle möglichen Antworten für ein Bild?

Ich arbeite daran, Tesseract zu verwenden, um alte Schriften zu finden. Tesseract als Werkzeug zeigt nur eine Antwort (Ausgabe) für ein Bild, und manchmal ist die Ausgabe falsch. Ich möchte in der Lage sein, alle möglichen Vorhersagen (Antworten) für jedes Bild zu sehen und eine von ihnen zu wählen,...
fragte agent2247 vor 5 Jahren

0
Bewertungen
1
Antwort
514
Ansichten

Wie kann ich Tesseract OCR für eine Chrome-Erweiterung hosten?

Derzeit arbeite ich am Entwurf einer Google Chrome-Erweiterung, die ein Bild aufnimmt. Dieses Bild setzt voraus, dass es mit dem Befehl (cmd) an Tesseract OCR übergeben wird und die Ausgabe als Text abruft. Ein Textbereich in der Erweiterung zeigt das Ergebnis. Ich weiß nicht, wo ich mit dem Hosting...

0
Bewertungen
0
Antworten
449
Ansichten

Tesseract 4.0 liest keine Bilder mit nur einem Text

Ich verwende Tesseract v4.0.0-beta.1-108-gf291 Das Bild 5.jpg wird nicht gelesen (ein Wort: Zeichen mit guter Größe) tesseract 5.jpg out.txt Ich habe alle möglichen --psm-Optionen ausprobiert nicht gelesen Das Bild (50.jpg) wird aber wirklich gut gelesen… Was ist hier los? Ein Wort wird nicht gelese...
fragte YounesCHTIOUI vor 5 Jahren

1
Bewertungen
0
Antworten
638
Ansichten

Können Untertitel von dvdsub über die Befehlszeile in srt konvertiert werden?

Gibt es eine Möglichkeit, dvdsub (bildbasierte) Untertitel in srt zu konvertieren? zum beispiel mit mencoder oder ffmpeg kombiniert mit tesseract? Ich suche etwas Kommandozeilenbasiertes, und ich bin in Ordnung mit ein paar Pässen gehen zu müssen. Ich bin weniger an GUI-basierten Tools interessiert.
fragte simone vor 6 Jahren

1
Bewertungen
0
Antworten
775
Ansichten

So erkennen Sie die Textsprache in einem Foto automatisch und übersetzen es

Es ist mir gelungen, eine OCR-App zu integrieren, um Text aus einem Foto ( https://obserbot.com/) zu erkennen, es wird jedoch nur exakter Text aus dem Foto abgerufen und nicht mehrsprachig konvertiert. Ich möchte, dass die App die Textsprache erkennt und automatisch in die Sprache des Lesers überset...
fragte Abdullah Hussain vor 7 Jahren

1
Bewertungen
0
Antworten
514
Ansichten

Wie trainiere ich Tesseract, um die Wellenlinien zu ignorieren, die durch die Erkennung von Rechtschreib- und Grammatikfehlern hinzugefügt wurden?

Ich verwende Tesseract zum Erkennen von Text in einer Vielzahl von Bildtypen, einschließlich Screenshots. Verwirrt werden die gewellten roten und blauen Unterstreichungen für Rechtschreib- und Grammatikwarnungen, wie im folgenden Beispiel. Am Ende bekomme ich entweder keinen Text oder ein Durcheinan...
fragte GdD vor 7 Jahren

0
Bewertungen
1
Antwort
1257
Ansichten

Optimale Schrift für Tesseract? (speziell der .NET-Wrapper)

Ich verwende Tesseract, um gedruckte Textdokumente, die mit meiner Handykamera aufgenommen wurden, in Text umzuwandeln. Die Ergebnisse sind nicht so toll. Die Qualität des Bildes ist sehr gut, viel klarer als ein Fax, aber es scheint sehr schwierig zu sein, Zeichen zu identifizieren. Ich habe auch v...
fragte user613051 vor 7 Jahren

2
Bewertungen
0
Antworten
678
Ansichten

Lustige OCR-Situation

Ich habe eine mehrseitig gescannte 300-dpi-PDF-Datei auf einem Ubuntu 16.04-System. Wenn ich den folgenden Befehl ausführen: pdfocr -t -l swe -i *.pdf -o newfile.pdf Es ergibt sich eine perfekt lesbare OCR-Datei. Jedes einzelne Wort ist in jeder Größe und Form der Schriftarten durchsuchbar. Der näc...
fragte Paul Bergström vor 7 Jahren

2
Bewertungen
0
Antworten
1215
Ansichten

Wie komprimiere ich Tesseract-kodierte PDFs, während der eingebettete Text von OCR erhalten bleibt?

Ich habe mit Tesseract experimentiert, um meine PDFs zu OCR zu machen, und es war meistens erfolgreich, insbesondere mit deutschen Fraktur-Texten (dem alten gotischen Druck), die Tools wie Adobe Acrobat nicht richtig erkennen können. Das Problem ist, dass die Ausgabedateien von Tesseract ziemlich g...

3
Bewertungen
1
Antwort
1204
Ansichten

Wie extrahiere ich Unicode-Zeichen aus der .png-Datei?

Ich möchte Unicode-Zeichen aus JPG- und PNG-Dateien extrahieren. Ich versuche es mit folgendem Befehl: tesseract 1.png output.txt Dieser Befehl funktioniert für englische Zeichen, aber wenn ich es für Unicode wie Hindi, Marathi oder Devanagari Script versuche, führt dies zu einer falschen Ausgabe....
fragte Madhav Nikam vor 8 Jahren

1
Bewertungen
1
Antwort
1570
Ansichten

Wie kann OCR dieses Bild erkennen?

Original Bild Ich denke, die Ziffern aus diesem Bild zu erkennen, wäre wirklich einfach, aber es ist einfach nicht an Tesseract und viel Online-OCR zu erkennen. Dann verarbeite ich es so. Prozessabbild Leider kann es vom Tesserakt noch nicht erkannt werden. Mein Tesseract-Parameter: tesseract inpu...
fragte too lazy to log in vor 8 Jahren

1
Bewertungen
1
Antwort
1071
Ansicht

In jTessBoxEditor for Tesseract wird das Kombinieren mehrerer TIFF / Box-Dateien in einer trainierten Datendatei beschrieben

Ich denke, dass dies mit der Befehlszeile möglich wäre, aber wie es mit jTessBoxEditor zu tun ist, da dies einen großen Workflow automatisieren würde. Da jTessBox mehrseitige TIFF-Dateien unterstützt, denke ich, dass dies der Fall sein könnte, aber wie organisiere ich in diesem Fall Boxdateien?
fragte coldbreeze16 vor 8 Jahren

1
Bewertungen
0
Antworten
402
Ansichten

Tesseract unter Windows: Die Ausgaben sind immer unschädlich

Also versuche ich dieses Bild zu OCR: (Dies sind eigentlich Benutzernamen) Verwenden Sie diesen Befehl an der Windows-Eingabeaufforderung: tesseract screenshot.png out Die out.txt-Datei bringt jedoch immer unschöne Ergebnisse. In diesem Fall ist es: belsahx Was mache ich falsch? Ist es der weiße...
fragte yasuo vor 8 Jahren

0
Bewertungen
1
Antwort
958
Ansichten

Wie kann man mit dem OCR-Tool pdfsandwich verzerrte Ergebnisse vermeiden?

In der Regel müssen gescannte Seiten vor dem Anwenden eines OCR-Tools schräggestellt werden. Hier ist meine Eingabe eine gerade gescannte Seite, und der OCR-Ausgang ist manchmal im oder gegen den Uhrzeigersinn schief. In meinem Anwendungsfall eines 260-seitigen englischen Buches geschieht dies für 1...
fragte lalebarde vor 9 Jahren

1
Bewertungen
0
Antworten
718
Ansichten

Deaktivieren Sie das Wörterbuch in Tess4J

Die Genauigkeit der Zeichenerkennung in meiner tess4j OCR-Anwendung ist sehr gering. Ich habe gehört, dass das Deaktivieren des Wörterbuchs in tess4j die Genauigkeit erhöht, indem einzelne Zeichen erkannt werden. Aber ich weiß nicht, wie es geht. Weiß jemand, wie man das Wörterbuch in tess4j ausscha...
fragte Chalaka Ellawala vor 9 Jahren

1
Bewertungen
1
Antwort
3940
Ansichten

Verwenden Sie ffmpeg für die Umwandlung von JPEG in TIFF

Ich möchte Tesseract OCR mit einem Video verwenden. Mit ffmpeg kann ich einige ( .jpeg) Bilder aus einem Video exportieren . Kann ich mit ffmpeg ein .jpegin ein gültiges konvertieren .tiffoder .tiffBilder direkt aus dem Video exportieren ?

1
Bewertungen
2
Antworten
1806
Ansichten

Tesseract auf Linux

So lösen Sie das Problem, ohne dass bei einer Warnung tesseract 3.03 installiert werden muss: Warnung: Sie führen eine nicht unterstützte Version von Tesseract aus. In Erwartung von Version 3.03 ist Ihre Version: 3.02.02 Fehler beim Öffnen der Datendatei /usr/local/share/tessdata/lus.traineddata St...
fragte Rogerrubens vor 9 Jahren

0
Bewertungen
0
Antworten
3403
Ansichten

Tesseract konnte keine Sprachen laden

Beim Ausführen des tesseract makeboxBefehls wurde der folgende Fehler ausgegeben Error opening data file /opt/local/share/tessdata/eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Failed loading language 'eng' Tess...

5
Bewertungen
1
Antwort
4486
Ansichten

Tesseract OCR: Nicht unterstützter Bildtyp

Ich habe die PDF-Datei in die TIF-Datei mit den folgenden Befehlen auf dem Terminal konvertiert convert -density 300 -depth 4 lang.font-name.exp0.pdf lang.font-name.exp0.tif convert lang.font-name.exp0.tif -colorspace rgb -type truecolor lang.font-name.exp0.tif Dann versuchte ich, den makeboxBefehl...

4
Bewertungen
2
Antworten
5846
Ansichten

Tesseract 3.03 englischsprachige Daten

Tesseract 3.03 wurde kürzlich veröffentlicht und ich habe es gerade installiert. Englischsprachige Daten werden jedoch nicht mit dem Download bereitgestellt (von https://launchpad.net/ubuntu/+source/tesseract/3.03.03-1 ). Auf der Tesseract-Website gibt es einen "Download" -Link, aber Sie können nur...
fragte MarAja vor 9 Jahren

3
Bewertungen
1
Antwort
4904
Ansichten

OCR mit nichtsprachlichem Text

Ich bin daran interessiert, OCR zu verwenden, um Text aus einem Dokument zu erkennen, das keine Wörter enthält. Es handelt sich vielmehr um ein Dokument mit einer langen Folge von "zufälligen" gedruckten Zeichen. Ich habe versucht, Tesseract zum Scannen des Textes zu verwenden, aber es scheint nach...
fragte Daniel vor 10 Jahren

2
Bewertungen
1
Antwort
2013
Ansichten

Tesseract hocr und txt gleichzeitig oder Konvertierung von Tesseracts hocr in txt

Ich habe mit Linux OCR-Software herumgespielt und mag Tesseract sehr, besonders in Verbindung mit gsan2pdf. Tesseract v3 oder höher unterstützt die Ausgabe im hocr-Format, und gscan2pdf kann dies nutzen, um durchsuchbare PDFs gescannter Dokumente zu erstellen. Manchmal möchte ich jedoch auch die Nur...
fragte PSkocik vor 10 Jahren

0
Bewertungen
2
Antworten
2301
Ansicht

GIFs können nicht mit Tesseract in OSX verarbeitet werden

Folgende Fehlermeldung wird angezeigt: Tesseract Open Source OCR Engine v3.02.02 with Leptonica Error in pixReadStreamGif: function not present Error in pixReadStream: gif: no pix returned Error in pixRead: pix not read Unsupported image type. Irgendwelche Ideen warum?
fragte Sherzod vor 11 Jahren

1
Bewertungen
1
Antwort
1530
Ansichten

TesseractOCR individuelle Schulung

Ich verstehe es nicht, wie soll ich Tesseract sagen, dass es sich tatsächlich um a b cBuchstaben handelt? Anhängen von makebox in cli erzeugte diese Datei: C 78 127 104 166 0 l 96 127 118 166 0 . 116 127 126 140 0 - 124 127 130 145 0 j 145 127 162 188 0 o 154 127 183 158 0 b 203 131 241 164 0
fragte Jim vor 11 Jahren

5
Bewertungen
3
Antworten
14561
Ansicht

OCR-Tesseract, leerer Seitenfehler?

Ich habe es aus Quellen mit zusammengestellt leptonica. Dies ist ein PNG-Bild mit transparentem Hintergrund, das ich bearbeitet habe, indem ich eine blaue Farbe hinzugefügt habe und immer noch diesen Fehler: Tesseract Open Source OCR Engine v3.02.02 with Leptonica Empty page!! Empty page!! Hier ist...
fragte Jim vor 11 Jahren

2
Bewertungen
0
Antworten
583
Ansichten

Tesseract kann nicht scannen: Fehler: Nur 1,2,4,5,6,8 bpp werden unterstützt: 32`

Obwohl ich das tat, convert canvas.png -depth 8 canvas.tifsehe ich immer noch diese Fehlermeldung: Tesseract Open Source OCR Engine check_legal_image_size:Error:Only 1,2,4,5,6,8 bpp are supported:32 Segmentation fault Kann mir jemand erklären warum?
fragte Jim vor 11 Jahren

0
Bewertungen
1
Antwort
481
Ansicht

Die gImageReader-Zwischenablage funktioniert nicht unter Windows

Ich verwende gImageReader, um OCR unter Windows 7 auszuführen, und obwohl ich aus der Anwendung selbst kopieren kann, kann ich nicht in die externe Windows 7-Zwischenablage kopieren. Ich glaube, das Programm basiert auf gtk, und möglicherweise muss eine Einstellung in gtk geändert werden, um diese F...
fragte leeand00 vor 11 Jahren

0
Bewertungen
3
Antworten
6530
Ansichten

Installieren Sie Tesseract OCR 3 unter OSX

Ich versuche, Tesseract OCR unter OSX 10.6 zu installieren ... Ich bin so weit gekommen, Leptonic (durch Herunterladen von src und Installieren mit ./configure; make; sudo make install) scheinbar ohne Probleme zu installieren - aber ich weiß nicht, wie ich das überprüfen soll. Ich habe auch Tesserac...
fragte Billy Moon vor 12 Jahren

3
Bewertungen
1
Antwort
3031
Ansicht

Tesseract-OCR für englische Schriftarten trainieren

Ich habe etwa 3000 kleine Bilder von einzelnen Wörtern, die ich in Text umwandeln möchte. Ich habe Tesseract auf meinem Windows 7-Computer mit dem Installationsprogramm installiert und konnte OCR-Images über Cmd und Powershell erfolgreich verwalten. tesseract.exe imagename.png imagename erzeugt ei...
fragte andrew vor 13 Jahren