26. November 2019

#explainIT: Machine Learning erklärt


Kategorie: Service

Ein Beitrag von:

Dr. Stefan Döring
Dr. Stefan Döring

Co-Autor:
Benjamin Wimmer - Benjamin Wimmer

„Machine Learning“ oder „Maschinelles Lernen“ (ML) ist ein Teilgebiet der künstlichen Intelligenz. Durch das Erkennen von Mustern aus Beispielen können IT-Systeme eigenständig Probleme lösen. Wir erklären unter der Rubrik #explainIT, wie es funktioniert:

Was versteht man unter Machine Learning?

Generell gilt, dass ein System mit künstlicher Intelligenz aus Beispielen lernt. Dies bedeutet allerdings keineswegs, dass solche Systeme Aufgaben stupide auswendig lernen. Vielmehr identifizieren sie Muster und Gesetzmäßigkeiten in den Daten. Diese Fähigkeit zur Mustererkennung hilft dann auch bei der Beurteilung neuen Situationen, Probleme oder Daten. Die einmal erkannten – oder auch „trainierten“ – Muster werden angewendet.

„Machine Learning“ bezeichnet nun eine Sammlung von mathematischen Methoden der Mustererkennung. Sie beschäftigt sich mit der Fragestellung, wie eine künstliche Intelligenz lernt.

Um ein System lernfähig zu machen und ihm so zu ermöglichen, Lösungen zu verschiedenen Problemstellungen zu finden, müssen entsprechende Vorkehrungen getroffen werden. Dem System übermittelt man vorab beispielsweise Daten und Algorithmen. Darauf aufbauend werden Regeln zur Analyse der Daten und zur Erkennung von sich wiederholenden Mustern benötigt. Mehr dazu im Video:

Youtuber Doktor Whatson erklärt das Prinzip des maschinellen Lernens im Zusammenhang mit neuronalen Netzen, Quelle: YouTube

Unüberwachtes und überwachtes Lernen

Grundsätzlich unterscheidet man in diesem Fall zwischen zwei Typen von Machine Learning: das unüberwachten und das überwachte Lernen.

Beim unüberwachten Lernen weiß das System nicht, was es lernen soll. Der Algorithmus versucht selbständig, in einem beliebigen Datensatz Strukturen zu erkennen und dadurch gewisse Cluster oder Kategorien abzuleiten. Werden zum Beispiel hinreichend Bilder ausgewertet, auf denen jeweils Äpfel und Birnen zu sehen sind, wird das System bestenfalls am Ende „gelernt“ haben, wie ein Apfel und wie eine Birne jeweils aussieht. Auf einem neuen Bild wird das System dann Äpfel und Birnen mit hoher Wahrscheinlichkeit „erkennen“ und unterscheiden können. Beim unüberwachten Lernen wird das System also im Vorfeld ohne entsprechende Trainingsdaten zu den Kategorien „Apfel“ oder „Birne“ gefüttert.

Beim überwachten Lernen hingegen wird das System bereits zu Beginn mit bestimmten Beispielen und Anwendungsfällen versorgt. Es weiß also schon grundsätzlich, wie ein Apfel aussieht und gibt bei entsprechenden Eingangsparametern das Ergebnis „Kategorie Apfel“ aus. Hier wird das System quasi vorab „trainiert“.

Beide Typen von Algorithmen sind nicht klar abgegrenzt. So gibt es also auch Machine Learning Methoden, die eine Kombination beider Ansätze verwenden.

Beispiele für die Verwendung von Machine Learning

Obwohl grundlegende Forschungsarbeiten bereits in den 1940er Jahren begannen, hat der Einsatz von maschinellem Lernen erst in den letzten zwei Jahrzehnten wirklich an Fahrt aufgenommen. Dies war natürlich begünstigt durch technologische Fortschritte – wie die zunehmende Leistungsfähigkeit und Speicherkapazität der Rechensysteme.

Wie bereits erwähnt, wird Machine Learning heute zum Beispiel für die Erkennung und Auswertung von Bildern verwendet. Die Bilderkennung stellt allerdings bei weitem nicht das einzige Anwendungsgebiet dar. Machine Learning Algorithmen werden auch für autonom fahrenden Autos genutzt. Aus Daten verschiedener Sensoren werden die Fahrzeugumgebung analysiert und Entscheidungen getroffen. Außerdem hilft machinelles Lernen dabei, Muster und Zusammenhänge in Patientenakten zu erkennen, die der menschlichen Analyse der Ärzte vielleicht entgehen. Behandlungen können so optimiert werden.

Doch obwohl viel Geld und Zeit investiert wurde, ist man von der Perfektion des Machine Learnings ein gutes Stück entfernt. So haben Algorithmen selbst mit einfachen Anwendungen, wie der korrekten Identifizierung von Objekten auf Bildern, immer noch Schwierigkeiten.

Statt Panzer die Sonne erkannt

So kursiert beispielsweise der, in Forscherkreisen bekannte, Fall eines Systems, das darauf trainiert wurde, Panzer auf Bildern zu identifizieren. Der Trainingsdatensatz bestand aus Werbebildern der Herstellerfirmen von Panzern und zufälligen anderen Bildern, auf denen kein Panzer zu sehen war. Scheinbar ein perfektes Setting für Machine Learning.

Das System funktionierte in dieser Anwendung aber nicht ganz so gut. Viele Panzer wurden nicht identifizieren. Interessanterweise filterte es stattdessen Bilder heraus, auf denen die Sonne schien. Die Problematik war schnell erkannt: Auf den eingespeisten Panzerbildern hatte ebenfalls stets die Sonne geschienen. Werbebilder eben. Maschinell hatte das System also das Bildelement „Sonne“ als fixe Eigenschaft angenommen und „Panzer“ zugeordnet.

Leider sind in der Praxis solche Fehler nicht so leicht identifizierbar. Die Gefahr des Machine Learnings besteht genau darin: Dass das System Fehler macht, ohne dass es den Nutzerinnen und Nutzern auffällt. Ursache sind nicht selten qualitativ schlechte oder nur einseitige Daten (es scheint immer die Sonne), mit denen die Systeme lernen sollen. Diskriminierung oder andere Fehlendscheidungen können die Folge sein.

Kommentare (0)

 
Schreiben Sie doch den ersten Kommentar zu diesem Thema.

Kommentar absenden

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Weitere Beiträge

Teilen