Extrahiere OCR-Text aus Evernote

16959
Leigh Riffel

Evernote führt OCR für die darauf gespeicherten Bilder durch. Gibt es eine Möglichkeit, ein Volltextäquivalent für ein Bild in Evernote zu erhalten, oder ist die OCR nur für die Suche geeignet?

13

6 Antworten auf die Frage

15
Peter Štibraný

Die Evernote-API bietet Funktionen zum Abrufen von Text und Rechteck, wenn dieser Text im Bild vorhanden ist. Siehe http://evernote.com/about/developer/api/evernote-api.htm . Informationen zum Abruf finden Sie unter "Evernote Recognition Index XML-Format" und unter Funktionen. Das Problem ist, dass sie keine traditionellen OCRs ausführen. Ihr OCR-Algorithmus kann andere Wörter für ein einzelnes "Wort" im Bild erzeugen. Sie verwenden es nur für die Suche, also ist dies für sie in Ordnung, aber nicht als Erkennungsmaschine. (Sie geben zwar Gewicht für jede Wortalternative, daher können Sie das vielleicht verwenden.)

11
Mike Dunham

Evernote entscheidet offenbar auch nicht, dass ein bestimmtes Bild genau einem Wort entspricht. Evernote bestimmt nicht, dass ein bestimmtes Bild "Hinweis" ist und nicht "fällig" ist. Vielmehr verfolgt es beides und eine Suche nach einem der beiden würde dasselbe Bild zurückgeben. Daher ist es nicht möglich, ein Volltextäquivalent zu erhalten, da Evernote nicht entscheidet, was der vollständige Text ist, sondern nur, was er sein könnte.

5
akira

evernote pays a decent sum to the creator of the ocr-stuff OR paid a decent sum to put something working together. thus, i really doubt that they will let you get the extracted text (+ positioning on the image).

(could be a business model, to scan other peoples images and provide good ocr :))

so, the answer is: no.

Das stimmt nicht. Es gibt eine API, um genau diese Informationen zu erhalten. Sehen Sie meine Antwort. Peter Štibraný vor 13 Jahren 3
2
Bruce Kessel

Ich bin mir nicht sicher, wie viel Raffinesse Sie benötigen, aber da ich auch Adobe Acrobat verwende, klicke ich mit der rechten Maustaste auf meinen Evernote-Anhang, um ihn mit Acrobat zu öffnen.

Dann wähle ich in Acrobat "Dokument | OCR-Texterkennung" aus und speichere das Dokument als reinen Text.

Dies funktioniert gut für mich, da ich nur eine gelegentliche OCR-Konvertierung benötige.

1
Max Masnick

Wenn Sie alle Bilder von Evernote erhalten könnten, können Sie die OCR mit Google Docs erledigen.

Sie können einen Ordner mit Bildern in Google Docs hochladen und diese in Dokumente konvertieren lassen, die sowohl das Bild als auch den OCR-Text enthalten.

Sie können dann alle diese Dokumente stapelweise als einfachen Text herunterladen, wodurch das Bild entfernt wird.

Wenn Sie alle Evernote-Bilder mit einem Hash versehen (z. B. md5), sollte es einfach sein, aus Google Docs heruntergeladene Textdateien mit dem Originalbild zu verknüpfen.

0
Pete Nikolai

Ich bin unter Windows und verwende Adobe Acrobat Pro und Word. Ich mache also Folgendes:

  1. Wenn die Datei nicht als JPG gespeichert wird, klicken Sie in Evernote auf das Augensymbol in der oberen linken Ecke des Bildes, um sie im Foto-Viewer zu öffnen, und klicken Sie auf Datei> "Kopie erstellen", um sie als JPG zu speichern
  2. Navigieren Sie zur Explorer-Datei
  3. Klicken Sie mit der rechten Maustaste darauf und wählen Sie "In Adobe PDF konvertieren" (die Datei wird in Acrobat geöffnet).
  4. Klicken Sie auf Datei> Speichern unter und wählen Sie Rich Text Format aus der Dropdown-Liste "Dateityp" aus, um die Datei als Rich Text-Datei zu speichern (die Verarbeitung der Datei dauert eine Minute).
  5. Durchsuchen Sie die RTF-Datei im Explorer und doppelklicken Sie, um sie in Word zu öffnen
  6. Bearbeiten Sie nach Bedarf
Dies scheint ein Hinweis darauf zu sein, wie Text aus einer bestimmten Bilddatei extrahiert wird, nicht aus einem Bild in Evernote. Können Sie erläutern, wie die ursprüngliche Frage beantwortet wird und die vorherigen und akzeptierten Antworten dies nicht tun? music2myear vor 7 Jahren 0