Wie funktioniert das Captcha "Ich bin kein Roboter"?

1848
gbambo

Ist es eine Grafik, die sperrige OCR erfordert, die den meisten Bots (anscheinend) fehlt? Trotzdem handelt es sich um eine feste Grafik, bei der es sich nicht wirklich um OCR handelt, bei der nur ein einfacher Musterabgleich mit einer Bibliothek eines Elements erfolgt. Ich verstehe einfach nicht, wie es eine unüberwindliche Hürde darstellt, um Bots zu vereiteln.

3
Welchen Typ fragst du gerade? Das letzte, das ich gesehen habe, hatte 9 Fotos und bat darum, auf die mit "Fußball" verknüpften Fotos zu klicken, zu denen der US-Typ und der Fußball gehören. Ich denke, auch Google-Bilder wären für einen Bot nicht sehr hilfreich Xen2050 vor 7 Jahren 0
Das Captcha-Recaptcha von Google verfügt über zahlreiche Parameter, mit denen Sie identifiziert werden. Schaut es euch hier an: https://stackoverflow.com/questions/27286232/how-does-new-google-recaptcha-work Ibrahim Hassan vor 7 Jahren 0

2 Antworten auf die Frage

3
Paul

Das Captcha überwacht das Verhalten der Maus. Es ist zwar für einen Bot leicht, auf eine Schaltfläche in einem Formular zu klicken, aber es ist schwierig, die unregelmäßige Bewegung einer Maus zu simulieren, die von einem Menschen bewegt wird.

Dies ist jedoch nicht unmöglich: https://www.youtube.com/watch?v=fsF7enQY8uI

Aber nur für den One-Click. Das Youtube-Video ist eine gute Ergänzung für Ihre Antwort .... El8dN8 vor 7 Jahren 0
Ich hätte genauer sagen sollen, über welche Art von Captcha ich sprach. Danke, das hat den angesprochen, den ich beabsichtigte. gbambo vor 7 Jahren 0
0
sirplus

Text in Captcha wird von OCR nicht erkannt. OCR verwendete Standardregeln, welcher Text Text erkennen soll.

Passender Text ist in der Regel verzerrt, nicht parallel in geraden Linien parallel; bis zum Horizont und enthalten zufälligen Müll, mit dem OCR nicht umgehen kann.

dh die üblichen Regeln, wie der Text aussehen soll, verfallen.

Mit zunehmender Verbreitung von Deep Learning ist es nur eine Frage der Zeit, bis Captchas nicht funktioniert.

Es gibt viele verschiedene Captchas, einige erfordern die Auswahl einer Anzahl von Grafiken, die ein Thema haben (z. B. welche Teile eines Zeichens sind, die später weiter verfeinert und dann der Bibliotheksmethode hinzugefügt werden können, sobald das gesamte Zeichen zusammengesetzt ist und die Textgrafik angezeigt wird) mit derselben Methode extrahiert), die ein Computer nicht erkennen kann. Bei diesem Typ werden Sie immer aufgefordert, ein bekanntes Szenario zu identifizieren, und in der Regel ein unbekanntes Objekt, das in die Bibliothek bekannter Dateien aufgenommen werden soll, sobald genügend identische Antworten eingehen.

Die am häufigsten verwendeten Bilder auf zwei Arten:

1
Ein einzelnes, zufällig verzerrtes Bild, das aus einem Wort generiert wurde, und zusätzlich Junk hinzugefügt, um die OCR zu verwechseln. Wie "Salting" ein Kennwort Liste durch Hinzufügen eines "zufälligen" Junk-Wortes, um einen Regenbogenangriff zu stoppen.

2
Eine andere Form ist die Verwendung von Fotos (meistens von Wörtern) von etwas, das die Leute entscheiden mussten, was es ist, weil das Bild zu komplex ist, um automatisch erkannt zu werden. Im Allgemeinen sind es außerhalb der Computerprogrammierungsparameter, was Text (oder ein Zeichen oder was auch immer) definiert und wird oft von einer zufälligen Umgebung umgeben.
Dies erfordert eine große Bibliothek mit Fotos mit bekanntem "Text" oder anderen Parametern, die Teil eines Zeichens sind usw.

Randbemerkung:
Die Bibliothek für die zweite Methode wird durch die Bereitstellung von 2 Bildern erweitert, die der Benutzer korrekt zu identifizieren versucht.
Ein Bild ist bekannt und ein anderes unbekannt.
Wenn Sie die bekannten Probleme richtig lösen, beweisen Sie, dass Sie kein Roboter sind.
Es gibt genug Leute, die das Unbekannte mit derselben Antwort abgleichen / beantworten, dann bedeutet, dass einer jetzt bekannt ist und der bekannten Bibliothek hinzugefügt werden kann.
So erkennt Google Maps, was eigentlich Straßen- / Ortsnamenschilder sind (und später den darin enthaltenen Text) und projizieren Gutenberg-Texte, deren OCR-Fehler nicht korrigiert wurden.