Neue Fragen mit dem Tag «tesseract-ocr»
Insgesamt gefunden 31 Frage
0
Bewertungen
0
Antworten
459
Ansichten
Fehler beim Training von Tesseract mit jTessBoxEditor
Ich habe etwa 50 Bilder in eine TIF-Datei mit jTessBoxEditor (Linux) zusammengeführt, aber wenn ich versuche, die .box-Datei mit diesem Code zu erhalten: tesseract mjchar.tif mjchar -l eng --psm 10 batch.nochop makebox ein Fehler ist aufgetreten: Tesseract Open Source OCR Engine v4.0.0-beta.1 mit...
fragte J.C.Liu vor 5 Jahren
0
Bewertungen
0
Antworten
409
Ansichten
Tesseract OCR: Wie zeige ich alle möglichen Antworten für ein Bild?
Ich arbeite daran, Tesseract zu verwenden, um alte Schriften zu finden. Tesseract als Werkzeug zeigt nur eine Antwort (Ausgabe) für ein Bild, und manchmal ist die Ausgabe falsch. Ich möchte in der Lage sein, alle möglichen Vorhersagen (Antworten) für jedes Bild zu sehen und eine von ihnen zu wählen,...
fragte agent2247 vor 6 Jahren
0
Bewertungen
1
Antwort
555
Ansichten
Wie kann ich Tesseract OCR für eine Chrome-Erweiterung hosten?
Derzeit arbeite ich am Entwurf einer Google Chrome-Erweiterung, die ein Bild aufnimmt. Dieses Bild setzt voraus, dass es mit dem Befehl (cmd) an Tesseract OCR übergeben wird und die Ausgabe als Text abruft. Ein Textbereich in der Erweiterung zeigt das Ergebnis. Ich weiß nicht, wo ich mit dem Hosting...
fragte user6512156 vor 6 Jahren
0
Bewertungen
0
Antworten
479
Ansichten
Tesseract 4.0 liest keine Bilder mit nur einem Text
Ich verwende Tesseract v4.0.0-beta.1-108-gf291 Das Bild 5.jpg wird nicht gelesen (ein Wort: Zeichen mit guter Größe) tesseract 5.jpg out.txt Ich habe alle möglichen --psm-Optionen ausprobiert nicht gelesen Das Bild (50.jpg) wird aber wirklich gut gelesen… Was ist hier los? Ein Wort wird nicht gelese...
fragte YounesCHTIOUI vor 6 Jahren
1
Bewertungen
0
Antworten
676
Ansichten
Können Untertitel von dvdsub über die Befehlszeile in srt konvertiert werden?
Gibt es eine Möglichkeit, dvdsub (bildbasierte) Untertitel in srt zu konvertieren? zum beispiel mit mencoder oder ffmpeg kombiniert mit tesseract? Ich suche etwas Kommandozeilenbasiertes, und ich bin in Ordnung mit ein paar Pässen gehen zu müssen. Ich bin weniger an GUI-basierten Tools interessiert.
fragte simone vor 7 Jahren
1
Bewertungen
0
Antworten
817
Ansichten
So erkennen Sie die Textsprache in einem Foto automatisch und übersetzen es
Es ist mir gelungen, eine OCR-App zu integrieren, um Text aus einem Foto ( https://obserbot.com/) zu erkennen, es wird jedoch nur exakter Text aus dem Foto abgerufen und nicht mehrsprachig konvertiert. Ich möchte, dass die App die Textsprache erkennt und automatisch in die Sprache des Lesers überset...
fragte Abdullah Hussain vor 7 Jahren
1
Bewertungen
0
Antworten
553
Ansichten
Wie trainiere ich Tesseract, um die Wellenlinien zu ignorieren, die durch die Erkennung von Rechtschreib- und Grammatikfehlern hinzugefügt wurden?
Ich verwende Tesseract zum Erkennen von Text in einer Vielzahl von Bildtypen, einschließlich Screenshots. Verwirrt werden die gewellten roten und blauen Unterstreichungen für Rechtschreib- und Grammatikwarnungen, wie im folgenden Beispiel. Am Ende bekomme ich entweder keinen Text oder ein Durcheinan...
fragte GdD vor 7 Jahren
0
Bewertungen
1
Antwort
1290
Ansichten
Optimale Schrift für Tesseract? (speziell der .NET-Wrapper)
Ich verwende Tesseract, um gedruckte Textdokumente, die mit meiner Handykamera aufgenommen wurden, in Text umzuwandeln. Die Ergebnisse sind nicht so toll. Die Qualität des Bildes ist sehr gut, viel klarer als ein Fax, aber es scheint sehr schwierig zu sein, Zeichen zu identifizieren. Ich habe auch v...
fragte user613051 vor 8 Jahren
2
Bewertungen
0
Antworten
714
Ansichten
Lustige OCR-Situation
Ich habe eine mehrseitig gescannte 300-dpi-PDF-Datei auf einem Ubuntu 16.04-System. Wenn ich den folgenden Befehl ausführen: pdfocr -t -l swe -i *.pdf -o newfile.pdf Es ergibt sich eine perfekt lesbare OCR-Datei. Jedes einzelne Wort ist in jeder Größe und Form der Schriftarten durchsuchbar. Der näc...
fragte Paul Bergström vor 8 Jahren
2
Bewertungen
0
Antworten
1259
Ansichten
Wie komprimiere ich Tesseract-kodierte PDFs, während der eingebettete Text von OCR erhalten bleibt?
Ich habe mit Tesseract experimentiert, um meine PDFs zu OCR zu machen, und es war meistens erfolgreich, insbesondere mit deutschen Fraktur-Texten (dem alten gotischen Druck), die Tools wie Adobe Acrobat nicht richtig erkennen können. Das Problem ist, dass die Ausgabedateien von Tesseract ziemlich g...
fragte Jason vor 8 Jahren
3
Bewertungen
1
Antwort
1243
Ansichten
Wie extrahiere ich Unicode-Zeichen aus der .png-Datei?
Ich möchte Unicode-Zeichen aus JPG- und PNG-Dateien extrahieren. Ich versuche es mit folgendem Befehl: tesseract 1.png output.txt Dieser Befehl funktioniert für englische Zeichen, aber wenn ich es für Unicode wie Hindi, Marathi oder Devanagari Script versuche, führt dies zu einer falschen Ausgabe....
fragte Madhav Nikam vor 8 Jahren
1
Bewertungen
1
Antwort
1605
Ansichten
Wie kann OCR dieses Bild erkennen?
Original Bild Ich denke, die Ziffern aus diesem Bild zu erkennen, wäre wirklich einfach, aber es ist einfach nicht an Tesseract und viel Online-OCR zu erkennen. Dann verarbeite ich es so. Prozessabbild Leider kann es vom Tesserakt noch nicht erkannt werden. Mein Tesseract-Parameter: tesseract inpu...
fragte too lazy to log in vor 8 Jahren
1
Bewertungen
1
Antwort
1101
Ansicht
In jTessBoxEditor for Tesseract wird das Kombinieren mehrerer TIFF / Box-Dateien in einer trainierten Datendatei beschrieben
Ich denke, dass dies mit der Befehlszeile möglich wäre, aber wie es mit jTessBoxEditor zu tun ist, da dies einen großen Workflow automatisieren würde. Da jTessBox mehrseitige TIFF-Dateien unterstützt, denke ich, dass dies der Fall sein könnte, aber wie organisiere ich in diesem Fall Boxdateien?
fragte coldbreeze16 vor 8 Jahren
1
Bewertungen
0
Antworten
438
Ansichten
Tesseract unter Windows: Die Ausgaben sind immer unschädlich
Also versuche ich dieses Bild zu OCR: (Dies sind eigentlich Benutzernamen) Verwenden Sie diesen Befehl an der Windows-Eingabeaufforderung: tesseract screenshot.png out Die out.txt-Datei bringt jedoch immer unschöne Ergebnisse. In diesem Fall ist es: belsahx Was mache ich falsch? Ist es der weiße...
fragte yasuo vor 9 Jahren
0
Bewertungen
1
Antwort
997
Ansichten
Wie kann man mit dem OCR-Tool pdfsandwich verzerrte Ergebnisse vermeiden?
In der Regel müssen gescannte Seiten vor dem Anwenden eines OCR-Tools schräggestellt werden. Hier ist meine Eingabe eine gerade gescannte Seite, und der OCR-Ausgang ist manchmal im oder gegen den Uhrzeigersinn schief. In meinem Anwendungsfall eines 260-seitigen englischen Buches geschieht dies für 1...
fragte lalebarde vor 9 Jahren
1
Bewertungen
0
Antworten
751
Ansicht
Deaktivieren Sie das Wörterbuch in Tess4J
Die Genauigkeit der Zeichenerkennung in meiner tess4j OCR-Anwendung ist sehr gering. Ich habe gehört, dass das Deaktivieren des Wörterbuchs in tess4j die Genauigkeit erhöht, indem einzelne Zeichen erkannt werden. Aber ich weiß nicht, wie es geht. Weiß jemand, wie man das Wörterbuch in tess4j ausscha...
fragte Chalaka Ellawala vor 10 Jahren
1
Bewertungen
1
Antwort
3982
Ansichten
Verwenden Sie ffmpeg für die Umwandlung von JPEG in TIFF
Ich möchte Tesseract OCR mit einem Video verwenden. Mit ffmpeg kann ich einige ( .jpeg) Bilder aus einem Video exportieren . Kann ich mit ffmpeg ein .jpegin ein gültiges konvertieren .tiffoder .tiffBilder direkt aus dem Video exportieren ?
fragte Tenaciousd93 vor 10 Jahren
1
Bewertungen
2
Antworten
1851
Ansicht
Tesseract auf Linux
So lösen Sie das Problem, ohne dass bei einer Warnung tesseract 3.03 installiert werden muss: Warnung: Sie führen eine nicht unterstützte Version von Tesseract aus. In Erwartung von Version 3.03 ist Ihre Version: 3.02.02 Fehler beim Öffnen der Datendatei /usr/local/share/tessdata/lus.traineddata St...
fragte Rogerrubens vor 10 Jahren
0
Bewertungen
0
Antworten
3443
Ansichten
Tesseract konnte keine Sprachen laden
Beim Ausführen des tesseract makeboxBefehls wurde der folgende Fehler ausgegeben Error opening data file /opt/local/share/tessdata/eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Failed loading language 'eng' Tess...
fragte Nina vor 10 Jahren
5
Bewertungen
1
Antwort
4523
Ansichten
Tesseract OCR: Nicht unterstützter Bildtyp
Ich habe die PDF-Datei in die TIF-Datei mit den folgenden Befehlen auf dem Terminal konvertiert convert -density 300 -depth 4 lang.font-name.exp0.pdf lang.font-name.exp0.tif convert lang.font-name.exp0.tif -colorspace rgb -type truecolor lang.font-name.exp0.tif Dann versuchte ich, den makeboxBefehl...
fragte Nina vor 10 Jahren
4
Bewertungen
2
Antworten
5882
Ansichten
Tesseract 3.03 englischsprachige Daten
Tesseract 3.03 wurde kürzlich veröffentlicht und ich habe es gerade installiert. Englischsprachige Daten werden jedoch nicht mit dem Download bereitgestellt (von https://launchpad.net/ubuntu/+source/tesseract/3.03.03-1 ). Auf der Tesseract-Website gibt es einen "Download" -Link, aber Sie können nur...
fragte MarAja vor 10 Jahren
3
Bewertungen
1
Antwort
4982
Ansichten
OCR mit nichtsprachlichem Text
Ich bin daran interessiert, OCR zu verwenden, um Text aus einem Dokument zu erkennen, das keine Wörter enthält. Es handelt sich vielmehr um ein Dokument mit einer langen Folge von "zufälligen" gedruckten Zeichen. Ich habe versucht, Tesseract zum Scannen des Textes zu verwenden, aber es scheint nach...
fragte Daniel vor 11 Jahren
2
Bewertungen
1
Antwort
2053
Ansichten
Tesseract hocr und txt gleichzeitig oder Konvertierung von Tesseracts hocr in txt
Ich habe mit Linux OCR-Software herumgespielt und mag Tesseract sehr, besonders in Verbindung mit gsan2pdf. Tesseract v3 oder höher unterstützt die Ausgabe im hocr-Format, und gscan2pdf kann dies nutzen, um durchsuchbare PDFs gescannter Dokumente zu erstellen. Manchmal möchte ich jedoch auch die Nur...
fragte PSkocik vor 11 Jahren
0
Bewertungen
2
Antworten
2367
Ansichten
GIFs können nicht mit Tesseract in OSX verarbeitet werden
Folgende Fehlermeldung wird angezeigt: Tesseract Open Source OCR Engine v3.02.02 with Leptonica Error in pixReadStreamGif: function not present Error in pixReadStream: gif: no pix returned Error in pixRead: pix not read Unsupported image type. Irgendwelche Ideen warum?
fragte Sherzod vor 11 Jahren
1
Bewertungen
1
Antwort
1565
Ansichten
TesseractOCR individuelle Schulung
Ich verstehe es nicht, wie soll ich Tesseract sagen, dass es sich tatsächlich um a b cBuchstaben handelt? Anhängen von makebox in cli erzeugte diese Datei: C 78 127 104 166 0 l 96 127 118 166 0 . 116 127 126 140 0 - 124 127 130 145 0 j 145 127 162 188 0 o 154 127 183 158 0 b 203 131 241 164 0
fragte Jim vor 11 Jahren
5
Bewertungen
3
Antworten
14625
Ansichten
OCR-Tesseract, leerer Seitenfehler?
Ich habe es aus Quellen mit zusammengestellt leptonica. Dies ist ein PNG-Bild mit transparentem Hintergrund, das ich bearbeitet habe, indem ich eine blaue Farbe hinzugefügt habe und immer noch diesen Fehler: Tesseract Open Source OCR Engine v3.02.02 with Leptonica Empty page!! Empty page!! Hier ist...
fragte Jim vor 11 Jahren
2
Bewertungen
0
Antworten
620
Ansichten
Tesseract kann nicht scannen: Fehler: Nur 1,2,4,5,6,8 bpp werden unterstützt: 32`
Obwohl ich das tat, convert canvas.png -depth 8 canvas.tifsehe ich immer noch diese Fehlermeldung: Tesseract Open Source OCR Engine check_legal_image_size:Error:Only 1,2,4,5,6,8 bpp are supported:32 Segmentation fault Kann mir jemand erklären warum?
fragte Jim vor 11 Jahren
0
Bewertungen
1
Antwort
520
Ansichten
Die gImageReader-Zwischenablage funktioniert nicht unter Windows
Ich verwende gImageReader, um OCR unter Windows 7 auszuführen, und obwohl ich aus der Anwendung selbst kopieren kann, kann ich nicht in die externe Windows 7-Zwischenablage kopieren. Ich glaube, das Programm basiert auf gtk, und möglicherweise muss eine Einstellung in gtk geändert werden, um diese F...
fragte leeand00 vor 11 Jahren
0
Bewertungen
3
Antworten
6601
Ansicht
Installieren Sie Tesseract OCR 3 unter OSX
Ich versuche, Tesseract OCR unter OSX 10.6 zu installieren ... Ich bin so weit gekommen, Leptonic (durch Herunterladen von src und Installieren mit ./configure; make; sudo make install) scheinbar ohne Probleme zu installieren - aber ich weiß nicht, wie ich das überprüfen soll. Ich habe auch Tesserac...
fragte Billy Moon vor 13 Jahren
3
Bewertungen
1
Antwort
3071
Ansicht
Tesseract-OCR für englische Schriftarten trainieren
Ich habe etwa 3000 kleine Bilder von einzelnen Wörtern, die ich in Text umwandeln möchte. Ich habe Tesseract auf meinem Windows 7-Computer mit dem Installationsprogramm installiert und konnte OCR-Images über Cmd und Powershell erfolgreich verwalten. tesseract.exe imagename.png imagename erzeugt ei...
fragte andrew vor 13 Jahren