Maschinen lernen wie kleine Kinder. Man zeigt ihnen Gegenstände, nennt sie und wiederholt alles so lange, bis sie es verstanden haben.
Wie bringt man einer Maschine bei, was eine Katze ist?
Durch Klassifikation. Klassifizieren bedeutet, zwei Objekte voneinander zu unterscheiden. Eine Maschine soll Hunde und Katzen unterscheiden – also zeigt man der Maschine entsprechende Fotos. Fotos, die Katzen zeigen, werden als „Katze“ klassifiziert. Bilder, die Hunde zeigen, werden nicht mit „Hund“, sondern mit „Keine Katze“ beschriftet. So lernt die Maschine, wie eine Katze aussieht und erstellt ihr eigenes Vorhersagemodell – ein sogenanntes predictive model.
Und wer macht diese Klassifizierungsarbeit?
Wir, die Internetnutzer. Denn jedes Mal, wenn wir eine Website besuchen und diese uns fragt „Bist du ein Mensch?“, kreuzen wir „Ja“ an. Die Website verlangt einen Beweis dafür, dass wir kein Roboter, sondern ein Mensch sind. Das sind die berühmten und „nervigen“ reCAPTCHAs.
CAPTCHA und re-CAPTCHA-Test
Ein CAPTCHA-Test besteht aus zwei einfachen Teilen: einer zufällig generierten Buchstaben- und/oder Zahlenfolge, die als verzerrtes Bild erscheint, und einem Textfeld. Um den Test zu bestehen und zu beweisen, dass Sie ein Mensch sind, müssen die Zeichen in das Textfeld eingegeben werden.[1]
reCAPTCHA arbeitet mit Bildern: „Wähle alle Bilder mit Ampeln aus“. Entsprechend wählt der Nutzer die Bilder aus und da Maschine „lernt“ wie eine Ampel aussieht.
Jeder Benutzer trägt so zur Klassifizierung und Erkennung der Bilder bei. Die kategorisierten Bilder verbessern die Qualität der Bilderdatenbank von Google.
Antwort
Was ist CAPTCHA? Ein Completely Automated Public Turing test to tell Computers and Humans Apart.
[1] https://support.google.com/a/answer/1217728?hl=de#:~:text=Ein%20CAPTCHA%2DTest%20besteht%20aus,sehen%2C%20einfach%20im%20Textfeld%20ein.