Supervised learning nutzt gekennzeichnete Datensätze, um KI zu trainieren
Supervised learning ist eine Art maschinellen Lernens , bei dem künstliche Intelligenz (KI) anhand gekennzeichneter Datensätze trainiert wird . Hier erfahren Sie, worum es beim überwachten Lernen geht, wie es funktioniert und welche Anwendungen es bietet.
Wie funktioniert Supervised learning?
Beim überwachten Lernen werden einem KI- Algorithmus Trainingsdaten (Eingaben) mit eindeutigen Beschriftungen (Ausgaben) zugeführt. Basierend auf dem Trainingssatz lernt die KI, wie sie zukünftige Eingaben unbeschrifteter Daten beschriften muss. Im Idealfall verbessert der Algorithmus seine Genauigkeit, wenn er aus früheren Erfahrungen lernt.
Wenn Sie einen KI-Algorithmus zum Klassifizieren von Formen trainieren möchten, zeigen Sie ihm Beispiele für korrekt beschriftete Formen zusammen mit Anweisungen, die die Gründe für jede Beschriftung erklären (zum Beispiel „Eine Form mit drei Seiten ist ein Dreieck“ oder „Eine Form mit vier Seiten ist ein Quadrat“).
Sobald Sie die Trainingsdaten bereitgestellt haben, testen Sie den Algorithmus, indem Sie ihm Formen ohne Beschriftungen zeigen. Die KI verwendet dann ihr Wissen aus dem Trainingssatz, um jeder Form die entsprechenden Beschriftungen/Ausgaben zuzuweisen.
Anwendungen des überwachten Lernens
supervised learning wird verwendet, um KI-Algorithmen für die Ausführung vieler Aufgaben zu trainieren, darunter:
- Bilderkennung : Identifizieren von Objekten oder Personen in Videos und Bildern.
- Spracherkennung : Stimmen Personen zuordnen und Audio in Text übersetzen.
- Handschrifterkennung : Übersetzung handgeschriebener Briefe in digitalen Text.
- Spam-Erkennung : Filtern von E-Mails und Textnachrichten, die wie Spam aussehen.
- Betrugserkennung : Kennzeichnung ungewöhnlicher Finanztransaktionen.
- Geografische Kartierung : Klassifizierung von Landformationen anhand von Satellitenbildern.
- Nachrichtenkategorisierung : Sortieren von Nachrichten nach Thema oder Region.
- Marketing : Ausrichtung der Anzeigen auf demografische Merkmale der Benutzer (Alter, Standort usw.)
- Predictive Analytics : Finanzielle Entscheidungen auf der Grundlage gewünschter Ergebnisse treffen.
Einschränkungen des überwachten Lernens
Um einen überwachten Lernalgorithmus angemessen zu trainieren, benötigen Sie viele genau gekennzeichnete Daten. Der Trainingsdatensatz muss außerdem vielfältig genug sein, damit der Algorithmus leichte Musterabweichungen erkennen kann.
Einer der Vorteile des überwachten Lernens ist seine hohe Genauigkeit. Eine hohe Genauigkeit ist jedoch nicht immer gut. Sie könnte nämlich auf Überanpassung hindeuten, d. h. wenn Trainings- und Testdaten zu ähnlich sind. Wenn Sie den Algorithmus testen, sollten sich die Testdaten ausreichend vom Trainingsdatensatz unterscheiden, um sicherzustellen, dass er in realen Umgebungen funktioniert.
Überwachtes vs. supervised learning
Beim unüberwachten Lernen sind die Trainingsdaten unbeschriftet , die KI muss also Muster erkennen und eigene Beschriftungen erstellen. Beim halbüberwachten Lernen ist ein Teil der Eingabedaten bereits beschriftet.
supervised learning kann zeitaufwändig sein, da ein Mensch oder ein Supervisor alle Daten im Trainingssatz beschriften muss. Ein Supervisor muss den Algorithmus auch auf Genauigkeit testen. Dies birgt die Möglichkeit menschlicher Fehler, daher muss die Person, die die Trainingsdaten beschriftet, ein Datenexperte sein.
Im Gegensatz zu unüberwachtem Lernen können überwachte Lernalgorithmen Daten nicht eigenständig klassifizieren. Wenn also einem überwachten Lernalgorithmus, der darauf trainiert ist, Dreiecke und Quadrate zu erkennen, ein Sechseck präsentiert wird, wäre er nicht in der Lage, es zu kennzeichnen. Wäre es ein unüberwachter Algorithmus, würde er das Sechseck weder als Dreieck noch als Quadrat erkennen und eine neue Kategorie erstellen.
Arten von überwachten Lernalgorithmen
Überwachte Lernalgorithmen können in zwei Typen unterteilt werden:
- Klassifizierung : Bei Klassifizierungsalgorithmen ist die Ausgabe eine Kategorie. Diese Algorithmen eignen sich ideal für binäre Klassifizierungen, beispielsweise um zu entscheiden, ob eine E-Mail Spam ist oder nicht. Sie können aber auch für kompliziertere Sortierungen verwendet werden, beispielsweise um eine Liste von Medikamenten nach Klasse zu organisieren.
- Regression : Bei Regressionsalgorithmen ist die Ausgabe ein numerischer Wert. Diese Algorithmen treffen Vorhersagen, wie z. B. das Schätzen von Immobilienwerten anhand der Postleitzahl oder das Vorhersagen der Temperatur anhand der Tageszeit.
Innerhalb dieser beiden Kategorien gibt es mehrere beliebte überwachte Lernalgorithmen wie lineare Regression, logistische Regression und naive Bayes-Klassifikatoren. Einige Algorithmen wie Support Vector Machines (SVM) und Random Forests kombinieren Elemente der Klassifizierung und Regression.
Überwachte Lernalgorithmen können mit neuronalen Netzwerken kombiniert werden , um ihre eigenen Ergebnisse neu zu bewerten und zu optimieren lightning connector.
Häufig gestellte Fragen
Selbst supervised learning ähnelt überwachtem Lernen darin, dass ein Algorithmus Beispiele aus der Vergangenheit verwendet, um neue Daten zu identifizieren. Der Unterschied besteht darin, dass beim selbstüberwachten Lernen keine Menschen Bezeichnungen vorgeben. Es unterscheidet sich jedoch auch insofern vom unüberwachten Lernen, als spätere Phasen eines selbstüberwachten Trainingsprogramms einige überwachte Aufgaben enthalten können.
supervised learning ist am nützlichsten, wenn Sie Objekte haben, die das Programm unbedingt erkennen soll. Programmierer für autonome Fahrzeuge möchten beispielsweise, dass die Fahrzeuge ein Stoppschild erkennen, wenn sie eines sehen. Die Anwendung von unüberwachtem Lernen dient eher dem Aufbau des Verständnisses eines bestimmten Fachgebiets (z. B. Physik).