Text in Captcha wird von OCR nicht erkannt. OCR verwendete Standardregeln, welcher Text Text erkennen soll.
Passender Text ist in der Regel verzerrt, nicht parallel in geraden Linien parallel; bis zum Horizont und enthalten zufälligen Müll, mit dem OCR nicht umgehen kann.
dh die üblichen Regeln, wie der Text aussehen soll, verfallen.
Mit zunehmender Verbreitung von Deep Learning ist es nur eine Frage der Zeit, bis Captchas nicht funktioniert.
Es gibt viele verschiedene Captchas, einige erfordern die Auswahl einer Anzahl von Grafiken, die ein Thema haben (z. B. welche Teile eines Zeichens sind, die später weiter verfeinert und dann der Bibliotheksmethode hinzugefügt werden können, sobald das gesamte Zeichen zusammengesetzt ist und die Textgrafik angezeigt wird) mit derselben Methode extrahiert), die ein Computer nicht erkennen kann. Bei diesem Typ werden Sie immer aufgefordert, ein bekanntes Szenario zu identifizieren, und in der Regel ein unbekanntes Objekt, das in die Bibliothek bekannter Dateien aufgenommen werden soll, sobald genügend identische Antworten eingehen.
Die am häufigsten verwendeten Bilder auf zwei Arten:
1
Ein einzelnes, zufällig verzerrtes Bild, das aus einem Wort generiert wurde, und zusätzlich Junk hinzugefügt, um die OCR zu verwechseln. Wie "Salting" ein Kennwort Liste durch Hinzufügen eines "zufälligen" Junk-Wortes, um einen Regenbogenangriff zu stoppen.
2
Eine andere Form ist die Verwendung von Fotos (meistens von Wörtern) von etwas, das die Leute entscheiden mussten, was es ist, weil das Bild zu komplex ist, um automatisch erkannt zu werden. Im Allgemeinen sind es außerhalb der Computerprogrammierungsparameter, was Text (oder ein Zeichen oder was auch immer) definiert und wird oft von einer zufälligen Umgebung umgeben.
Dies erfordert eine große Bibliothek mit Fotos mit bekanntem "Text" oder anderen Parametern, die Teil eines Zeichens sind usw.
Randbemerkung:
Die Bibliothek für die zweite Methode wird durch die Bereitstellung von 2 Bildern erweitert, die der Benutzer korrekt zu identifizieren versucht.
Ein Bild ist bekannt und ein anderes unbekannt.
Wenn Sie die bekannten Probleme richtig lösen, beweisen Sie, dass Sie kein Roboter sind.
Es gibt genug Leute, die das Unbekannte mit derselben Antwort abgleichen / beantworten, dann bedeutet, dass einer jetzt bekannt ist und der bekannten Bibliothek hinzugefügt werden kann.
So erkennt Google Maps, was eigentlich Straßen- / Ortsnamenschilder sind (und später den darin enthaltenen Text) und projizieren Gutenberg-Texte, deren OCR-Fehler nicht korrigiert wurden.