Grundlagen

Wie lernt KI?

Wie lernt KI - Roboterhand zeigt auf Neuronennetz
© pexels.com/Tara Winstead

Machine Learning und Deep Learning als Teilbereiche von Künstlicher Intelligenz unterstützen Menschen bei der Lösung komplexer statistischer und mathematisch logischer Probleme in Zusammenhang mit Datenanalyse. KI lernt durch Maschinelles Lernen, bedient sich dabei verschiedener Methoden zur Mustererkennung und kann, ohne explizit dafür programmiert zu sein, autonom lernen, Entscheidungen treffen, Wissen generieren und sich während des Lernprozesses eigenständig optimieren. Nachfolgend werden die verschiedenen Arten des maschinellen Lernens sowie dessen Lern- und Trainingsmethoden und Anwendungsbereiche beschrieben.

Machine Learning Methoden

  • Überwachtes Lernen (Supervised Learning)
  • Unüberwachtes Lernen (Unsupervised Learning)
  • Teilüberwachtes Lernen (Semi-Supervised Learning)
  • Verstärkendes Lernen (Bestärkendes Lernen, Reinforcement Learning)
  • Unter-/Sonderform – Deep Learning und Künstliche Neuronale Netze

Überwachtes Lernen (Supervised Learning)

Beim überwachten Lernen (auch „Supervised Machine Learning“) erhalten Machine Learning-Algorithmen beschriftete Datensätze zum Lernen. Ein Teil der Daten ist also bereits mit einem Label und folglich mit dem korrekten Analyse-Ergebnis versehen. Der mit diesem Datensatz trainierte Algorithmus wendet seine Erkenntnisse auf neue beschriftete Datensätze an und erzeugt auf deren Basis richtige Ergebnisse (GeeksforGeeks, 2022b).

Beim Supervised Learning werden zwei Kategorien unterschieden: die Klassifizierungsalgorithmen (Ausgabe-Variable ist eine Kategorie, z.B. rot oder grün) und Regressionsalgorithmen (Ausgabe-Variable ist ein reeller Wert, z.B. Währung, Gewicht) (GeeksforGeeks, 2022b).

Trainingsmethoden von Supervised Learning-Algorithmen

  • Regression / Logistische Regression (Logit-Modell)
  • Klassifizierung
  • Naive Bayes-Klassifikator
  • K-NN (k nearest neighbours)
  • Support Vector Machine
    (GeeksforGeeks, 2022b),
    sowie
  • Entscheidungsbäume (Decision Trees) – verwendet für Klassifizierungs- und Regressionsaufgaben (IBM., o. D.)

Anwendungsbeispiele Überwachtes Lernen

  • Online-Shops (Zukunftsprognosen zu Umsätzen, Filtern von E-Mails im Kundenservice, personalisierter Angebote für Kund:innen)
  • Personenerkennung auf Bildern
  • Handschrifterkennung
  • Automatisches Erkennen von Spam E-Mails
    (Luber, 2019)

Unüberwachtes Lernen (Unsupervised Learning)

Beim unüberwachten Lernen (auch „Unsupervised Machine Learning“) werden Machine Learning-Algorithmen eingesetzt, um unbeschriftete Datensätze zu analysieren oder zu clustern. Die Datensätze enthalten keine Labels bzw. Merkmale sondern werden ohne menschliches Zutun von den Algorithmen eigenständig auf Muster untersucht (IBM, 2022). Zur Anwendung kommen hier „u. a. die Methoden der hierarchischen und der K-Means-Clusterung“ (Kreutzer & Sirrenberg, 2019). Die Modelle des unüberwachten Lernens werden hauptsächlich für diese drei Aufgaben eingesetzt (IBM, 2022):

  • Clusteranalyse (Analyse von Ähnlichkeiten in Datensätzen und anschließende Gruppierung von Objekten oder Datenpunkten)
  • Assoziationsanalyse (Analyse von Beziehungen zwischen Datenpunkten* sowie deren Zusammenhänge und Abhängigkeiten**)
  • Dimensionsreduktion (Methode zur Modellanpassung in der Datenvorverarbeitungsphase durch Reduktion der Größe eines überdimensionierten Datensatzes zur Wahrung der Leistung des Lernalgorithmus und der Datenintegrität aufgrund Vermeidung von Überanpassung / Overfitting oder Unteranpassung / Underfitting) (IBM, 2022 und Markert, 2022)

Einsatzgebiete Unüberwachtes Lernen

Beim Unsupervised Learning werden zwei Kategorien unterschieden: die Clustering-Algorithmen (zum Auffinden von Gruppierungen in einem Datensatz) und Algorithmen die Assoziationen erkennen (Personen die das Produkt X kauften haben auch das Produkt Y gekauft) (GeeksforGeeks, 2022b). Die KI lernt anhand von Algorithmen, die Ähnlichkeiten und Unterschiede in Datensätzen erkennen. Die optimalen Einsatzgebiete sind deshalb (IBM, 2022):

  • Explorative Datenanalyse (EDA; Analyse von Daten mit kaum oder nicht vorhandenen Zusammenhängen***)
  • Cross-Selling-Strategien (Einleitung gezielter Online-Werbemaßnahmen: in 80 % der Fälle wird Produkt X, z.B. Bier, in Kombination mit Produkt Y, z.B. Kartoffelchips, online gekauft. Beide Produkte werden bei 10 % aller Online-Einkäufe bestellt. So können Erkenntnisse für Cross Marketing-Werbemaßnahmen gewonnen werden.**)
  • Kundensegmentierung (Erstellung von Personas/Kundenprofilen auf Basis von deren Kaufgewohnheiten und Abgleich von ähnlichem Kaufverhalten)
  • Bilderkennung / Computer Vision (Objekterkennung, Auswertung bildgebender Verfahren in der Medizin)
  • News / Nachrichtendienste (Google News kategorisiert Berichte verschiedener Online-Nachrichtendienste zu denselben Themen für seine Nachrichtenrubriken)
  • Empfehlungsmaschinen / Recommendation Machines (Entdeckung von Trends auf Basis einer Datenhistorie zum Kaufverhalten von Konsument:innen zur Effizienzsteigerung von Cross-Selling-Maßnahmen)

Teilüberwachtes Lernen (Semi-Supervised Learning)

Teilüberwachtes Lernen (auch „Halbüberwachtes Lernen“ oder „Semi-Supervised Machine Learning“) ist eine Mischform des Überwachten Lernens und des Unüberwachten Lernens. Beim Semi-Supervised Learning lernt die KI sowohl mit Trainingsdaten mit definierten Zielwerten als auch unbekannten Werten (Wuttke, 2022).

Trotz ähnlicher Anwendungsfelder in der Praxis, unterscheidet sich Teilüberwachtes Lernen von Überwachtem Lernen durch den Zeit- bzw. Lernaufwand während des Lernprozesses: Beim Semi-Supervised Learning wird „nur eine geringe Menge an Daten mit einer bekannten Zielvariable genutzt […] und eine große Menge an Daten, bei der diese Zielvariable noch nicht vorhanden ist,“ so Wuttke (2022). Der Vorteil des Halbüberwachten Lernens liegt darin, dass bereits mit einer geringen Menge an beschrifteten Daten in Datensätzen trainiert werden kann und dadurch keine Trainingsdaten beschafft oder vorab aufwendig manuell gekennzeichnet („gelabelt“) werden müssen (Wuttke, 2022).

Ein Anwendungsbeispiel für Teilüberwachtes Lernen ist Bild-/Objekterkennung: hierzu labeln (üblicherweise) Menschen im Vorhinein eine kleine Menge eines Bilddatensatzes, ehe z.B. ein künstliches neuronales Netz dazu trainiert wird, die Daten zu klassifizieren und das erlernte Wissen danach auf den restlichen Datensatz angewandt wird (Wuttke, 2022). „Was es dabei erkennen soll, leitet das System aus dem vorab Gelernten ab“, so Markert (2022), während in einzelnen Trainingsphasen Gewichtungen laufend angepasst und so die Trefferquote für die korrekte Klassifizierung der Bildinhalte erhöht wird. Bei den Lösungen handelt es sich allerdings um Annäherungen, da, anders als beim Überwachten Lernen, nur eine kleine Menge an Trainingsdaten zur Verfügung steht.

Anwendungsbeispiele Teilüberwachtes Lernen

Teilüberwachtes Lernen wird, neben der Bilderkennung, besonders bei Datensätzen angewandt, für die nur unzureichend Beispieldaten vorhanden sind, z.B. bei der Spracherkennung und regionalen Besonderheiten von Sprachen Markert (2022).

Verstärkendes Lernen (Reinforcement Learning)

Verstärkendes Lernen (auch „bestärkendes Lernen“, „Reinforcement Learning“ oder RL) funktioniert nach dem Trial and Error-Prinzip und erhaltenen Belohnungen beim Finden der richtigen Lösung für ein Problem. Für das Training des lernenden Systems werden beim Reinforcement Learning keine Ausgangsdaten benötigt. Das System lernt in mehreren Trainingsläufen durch die Analyse seiner Umgebung und anhand von Richtig-Falsch-Feedbackschleifen eigenständig Aktionen zu setzen und Strategien zur Problemlösung zu finden. Dabei setzen Algorithmen Belohnung als Multiplikator für Erfolg ein (Luber, 2019).

Verstärkendes Lernen ähnelt menschlichem Lernverhalten und wird u.a. von Künstlichen Neuronalen Netzen verwendet (Luber, 2019). „Künstliche Neuronale Netzwerke bilden die Lernergebnisse in ihren Neuronenschichten ab. Die Problemlösung ist in den Neuronen zwischen dem Input- und Output-Layer gespeichert,“ führt Luber (2019) aus.

Anwendungsbeispiele Verstärkendes Lernen

Steuerung, Monitoring und Optimierung komplexer Systeme (Lemke, 2022):

  • In Googles Rechenzentren wird KI-basierte Gleichstromkühlung eingesetzt, um komplexe Klimaanlagen-Systeme extrem energieeffizient durch verstärkendes Lernen zu regulieren
  • Verkehrssteuerung durch intelligente Regulierung von Ampelphasen
  • Dynamic Pricing im E-Commerce-Bereich für die Forcierung einer geeigneten Preisstrategie unter Berücksichtigung von Angebot und Nachfrage

Herausforderungen des KI-Lernens

Eigenschaften wie die Qualität, die Datenmenge und die Objektivität eines Trainingsdatensatzes sind von entscheidender Bedeutung für den Lernerfolg beim Machine Learning und die Aussagequalität der Berechnungen (Pratt, 2020). Das bedeutet beispielsweise beim Supervised Learning, dass die Maschine nur in gut aufbereiteten, kuratierten Datensätzen zielführende Zusammenhänge erkennen kann. Beim Unsupervised Learning können fachkundige Menschen, in der Regel Data Scientists, Rechenergebnisse interpretieren und korrigierend eingreifen, indem sie Parameter ändern und neu kalkulieren. Kommt Deep Learning zur Anwendung, so können Ungenauigkeiten in Datensätzen mit enorm viel Zeit- und Rechenaufwand kompensiert werden (Birk, 2022).

Weitere Problematiken beim Machine Learning sind

  • Overfitting – Überanpassung durch zu genaues Anlernen der Maschine auf die Trainingsdaten wodurch die Anwendung des Modells auf die Testdaten unmöglich wird (Birk, 2022),
  • Underfitting – Unteranpassung durch die Wahl eines zu einfachen, flexiblen Lernmodells und eines zu kleinen Trainingsdatensatzes (GeeksforGeeks, 2022),
  • Fehler in Datensätzen – fehlende Inhalte und Verknüpfungen, Mehrfachnennungen (Birk, 2022)
  • sowie Algorithmus-Bias (auch AI-Bias, KI-Verzerrung, Algorithmusverzerrung oder Verzerrung des maschinellen Lernens) – „ein Phänomen, das auftritt, wenn ein Algorithmus aufgrund falscher Annahmen im maschinellen Lernprozess systematisch voreingenommene („biased“) Ergebnisse liefert“ (Pratt, 2020)

Quellenverzeichnis:

* TIBCO Software Inc. (o. D.). Was ist unüberwachtes Lernen? TIBCO Software. Abgerufen am 23. Dezember 2022, von https://www.tibco.com/de/reference-center/what-is-unsupervised-learning

** Assoziationsanalyse. (2022). In Assoziationsanalyse. Abgerufen am 23. Dezember 2022, von https://de.wikipedia.org/wiki/Assoziationsanalyse

*** Begerow Beratungsgesellschaft mbH & Co. KG. (2019). Explorative Datenanalyse Definition & Erklärung | Datenbank Lexikon. datenbanken-verstehen.de. Abgerufen am 23. Dezember 2022, von https://www.datenbanken-verstehen.de/lexikon/explorative-datenanalyse/

Birk, S. (2022, 21. November). Supervised Learning: So funktioniert das KI-Modell. epoq.de, Abgerufen am 26. Dezember 2022, von https://www.epoq.de/blog/supervised-learning-ki-modell/

GeeksforGeeks. (2022, 22. August). ML | Underfitting and Overfitting. Geeksforgeeks.org. Abgerufen am 26. Dezember 2022, von https://www.geeksforgeeks.org/underfitting-and-overfitting-in-machine-learning/

GeeksforGeeks. (2022b, 24. August). Supervised and Unsupervised learning. Abgerufen am 20. Dezember 2022, von https://www.geeksforgeeks.org/supervised-unsupervised-learning/

IBM. (o. D.). What is a Decision Tree | IBM. www.ibm.com. Abgerufen am 22. Dezember 2022, von https://www.ibm.com/topics/decision-trees

IBM. (2022, 31. März). What is Unsupervised Learning?  | IBM. Abgerufen am 18. Dezember 2022, von https://www.ibm.com/cloud/learn/unsupervised-learning

Kreutzer, R. T. & Sirrenberg, M. (2019). Künstliche Intelligenz verstehen: Grundlagen – Use-Cases – unternehmenseigene KI-Journey (German Edition) (1. Aufl. 2019 Aufl.). Springer Gabler. https://doi.org/10.1007/978-3-658-25561-9

Lemke, C. (2022, 15. März). Verstärkendes Lernen im Einsatz – Voraussetzungen und Use Cases. Alexander Thamm GmbH. Abgerufen am 2. Jänner 2023, von https://www.alexanderthamm.com/de/blog/verstaerkendes-lernen-im-einsatz-voraussetzungen-und-use-cases/

Luber, S. (2019, 17. September). Was ist Bestärkendes Lernen? BigData-Insider. Abgerufen am 26. Dezember 2022, von https://www.bigdata-insider.de/was-ist-bestaerkendes-lernen-a-865378/

Markert, T. (2022, 7. April). Wie lernt KI? tuev-nord.de. Abgerufen am 23. Dezember 2022, von https://www.tuev-nord.de/explore/de/erklaert/wie-lernt-ki/

Pratt, M. K. (2020, 1. Juli). machine learning bias (AI bias). Enterprise AI. Abgerufen am 26. Dezember 2022, von https://www.techtarget.com/searchenterpriseai/definition/machine-learning-bias-algorithm-bias-or-AI-bias

Wuttke, L. (2022, 21. Mai). Machine Learning: Definition, Algorithmen, Methoden und Beispiele. datasolut GmbH. Abgerufen am 23. Dezember 2022, von https://datasolut.com/was-ist-machine-learning/


Wie lernt KI in aller Kürze:

Was ist Künstliche Intelligenz (KI)?

Künstliche Intelligenz (KI) bezieht sich auf die Fähigkeit von Computern und Maschinen, menschenähnliche Intelligenzleistungen wie Wahrnehmung, Entscheidungsfindung, Sprachverarbeitung und Problemlösung zu erbringen. Die KI umfasst verschiedene Technologien, darunter Machine Learning, Deep Learning und andere Methoden, die auf der Analyse großer Datenmengen basieren, um Muster und Zusammenhänge zu erkennen und selbständig Entscheidungen zu treffen.

Was ist Machine Learning?

Machine Learning ist ein Teilbereich der Künstlichen Intelligenz, der es Maschinen ermöglicht, aus Erfahrung zu lernen, ohne explizit programmiert zu werden. Es handelt sich um eine Methode, die es Computern ermöglicht, Muster in Daten zu erkennen, indem sie verschiedene Algorithmen anwenden und ihre Ergebnisse optimieren. Es gibt verschiedene Arten des Machine Learnings, darunter das überwachte Lernen, das unüberwachte Lernen, das teilüberwachte Lernen und das verstärkende Lernen.

Was ist Deep Learning?

Deep Learning ist ein Teilbereich des Machine Learnings und bezieht sich auf die Verwendung von künstlichen neuronalen Netzen, die in der Lage sind, große Mengen an unstrukturierten Daten zu verarbeiten und zu analysieren. Deep Learning wird häufig für Anwendungen wie Bild- und Spracherkennung, autonome Fahrzeuge und Robotik eingesetzt.

Was ist überwachtes Lernen?

Überwachtes Lernen ist eine Methode des Machine Learnings, bei der ein Algorithmus auf der Grundlage von beschrifteten Daten trainiert wird. Das bedeutet, dass der Algorithmus während des Trainings auf eine bestimmte Zielvariable hin optimiert wird. Beispiele für Anwendungen des überwachten Lernens sind die Klassifikation von Objekten oder das Vorhersagen von Werten.

Was ist unüberwachtes Lernen?

Unüberwachtes Lernen ist eine Methode des Machine Learnings, bei der ein Algorithmus auf der Grundlage von unbeschrifteten Daten trainiert wird. Das bedeutet, dass der Algorithmus während des Trainings auf Muster oder Strukturen im Datensatz optimiert wird. Beispiele für Anwendungen des unüberwachten Lernens sind die Clustering-Analyse oder die Dimensionsreduktion.

Similar Posts