Nun ja. Wir alle müssen von Zeit zu Zeit etwas lernen. In der Tat, du bist gerade dabei, etwas Neues zu lernen.
Als Kinder lernen wir, dass wir "bitte" und "danke" sagen müssen - unsere Eltern haben uns immer daran erinnert. Als Schüler mussten wir für unsere Fächer lernen, und als Erwachsene müssen wir wahrscheinlich neue Fähigkeiten erlernen, um in unserem Beruf bestehen zu können.
Wir alle mögen unterschiedliche Methoden zum Lernen haben.
Das gilt auch für die KI.
Es sind nicht die einzigen, aber die gängigsten Lernmethoden sind: Überwachtes Lernen, unüberwachtes und bestärkendes Lernen.
Schauen wir uns diese ein wenig an.
Beim überwachten Lernen (supervised learning) stellen wir dem Modell markierte Daten zur Verfügung. Das bedeutet, dass mit jedem Datensatz eine Lösung oder Antwort geliefert wird.
Wenn wir dem Modell also einen Haufen Bilder von Früchten geben und der Maschine sagen, welche Art von Obst die Bilder zeigen. Zum Beispiel, eine Banane, eine Orange oder eine Erdbeere.
Wenn wir dem Modell ein neues Bild vorlegen, kann es die Bezeichnung richtig vorhersagen, weil es sie mit den Eingabedaten, den beschrifteten Bildern von Obst, vergleicht.
Einfach, oder?
Überwachtes Lernen ist nützlich für Klassifizierungsprobleme, wie das Obstbeispiel. Es kann aber auch für so genannte "Regressionsprobleme" verwendet werden. Dies ist der Fall, wenn die Daten nicht diskret sind, also keine ganzen Zahlen enthalten, sondern kontinuierlich sind. Zum Beispiel die Vorhersage der Mietpreise von Wohnungen in bestimmten Ländern, Städten oder Bezirken.
Okay, gut, fahren wir mit dem unüberwachten Lernen (unsupervised learning) fort.
Der größte Unterschied zwischen diesen beiden Lernmethoden besteht darin, dass unüberwachte Lernmodelle Daten erhalten:
Nicht gekennzeichnete Daten
Das Modell wäre also nicht in der Lage zu wissen, dass das Bild der Banane eine echte Banane zeigt, weil es nicht auf diese Weise gekennzeichnet wurde.
Aber wie lernt das Modell dann und kommt auf das Ergebnis?
Indem es Muster, Ähnlichkeiten oder Gruppierungen in den Daten findet.
Es gruppiert Bananen richtig, weil es erkennt, dass sie gelb und gekrümmt sind.
Es gruppiert Orangen richtig, weil es erkennt, dass sie orange und rund sind.
Und das Gleiche gilt für Erdbeeren, weil sie rot sind und ein grünes Blatt haben.
Auf diese Weise kann das Modell die Früchte voneinander unterscheiden.
Es gibt auch eine Mischform, das so genannte halb-überwachte Lernen, bei dem dem Modell eine kleine Menge an gekennzeichneten Daten und eine große Menge an nicht gekennzeichneten Daten zur Verfügung gestellt wird.
Nun gut. Wenn du gut aufgepasst haben, weißt du, dass wir zwei der drei Lernmethoden, die wir in diesem Artikel behandeln wollen, behandelt haben.
Jetzt werden wir uns mit dem bestärkenden Lernen befassen, das nichts mit den beiden vorherigen Lernmethoden zu tun hat.
Bestärkendes Lernen (reinforcement learning) finden wir z. B. bei Staubsaugerrobotern oder beim autonomen Fahren.
Es lernt durch die Interaktion mit seiner Umgebung und durch Trial-and-Error.
Nehmen wir den Staubsaugerroboter als Beispiel.
Ihr Ziel: den Boden Ihrer Wohnung zu reinigen.
Wenn du ihn einrichtest, kennt er noch nicht die richtigen Wege, um sein Ziel zu erreichen. Also bewegt er sich herum und lernt durch Trial-and-Error. Wenn er gegen etwas stößt und die Sensoren ausgelöst werden, dreht er sich und bewegt sich vorwärts, bis er einen freien Weg findet. Mit der Zeit weiß er, wie er durch Ihre Wohnung navigieren kann, ohne gegen Hindernisse zu stoßen.
Perfekt.
Fassen wir dies zusammen.
Überwachtes Lernen = durch gekennzeichnete Input- und Output Daten können Modelle lernen, das richtige Ergebnis vorherzusagen, wenn sie eine neue Eingabe erhalten
Unüberwachtes Lernen = Maschinen organisieren unmarkierte Eingabedaten, indem sie Muster und Ähnlichkeiten finden
Bestärkendes Lernen = Maschinen interagieren mit ihrer Umgebung, führen Aktionen aus und lernen durch Trial-and-Error.
Nicht zu vergessen ist natürlich auch das halbüberwachte Lernen, bei dem das Modell eine kleine Menge an gekennzeichneten und eine große Menge an nicht gekennzeichneten Daten für das Training verwendet.
Gut gemacht.
Jeder, der lernt, muss auch mal eine Pause machen. Viel Spaß.