Newsletter 02/2022
Unser Experte Oliver Gnepper teilt seine Sicht auf die Frage, wie Prozessexperten effektiv in die Entwicklung und Interpretation von maschinellen Lernmodellen einbezogen werden können.
Dass Daten einen signifikanten Mehrwert für Unternehmen darstellen können, bestreiten heute wahrscheinlich nur noch die Wenigsten. Jedoch zeigt sich bei eigehender Analyse von Daten aus Produktionsprozessen die Unvollständigkeit der Datenerfassung und die damit einhergehende Reduktion des durch Daten zu hebenden Potentials. Typische Unzulänglichkeiten sind:
- unvollständige Repräsentation von Prozessen im Datenraum,
- mangelnde Vernetzung von Prozessen und Domänen im Datenraum,
- fehlende Qualitätssicherung bei der Datenerfassung und
- unzureichende oder veraltete Schnittstellen für die Eingabe von Daten durch Menschen.
Insbesondere der letzte Punkt stellt eine nicht zu unterschätzende Hürde dar. Oft ist wichtiges Prozesswissen nur implizit in den Köpfen weniger Experten vorhanden, welche nur zeitlich begrenzt zur Verfügung stehen. Sind diese Personen gerade nicht verfügbar bedarf es eines erheblichen Mehraufwandes, um plötzlich auftretende Probleme innerhalb von Prozessen zu beheben sowie die Prozesssicherheit und –stabilität zu gewährleisten. Vor allem auf lange Sicht ergeben sich Risiken durch das Ausscheiden relevanter Wissensträger aus dem Unternehmen. Zwar finden sich in Unternehmen unterschiedlichste Varianten, um vorhandenes Wissen zu sichern und einer breiten Masse zur Verfügung zu stellen. Jedoch geht bei der Übertragung immer Wissen verloren und die Kontrolle des übertragenen Wissens erfolgt oft nicht, da zwischen den Konsumenten und den Wissensvermittlern nur begrenzt Kontakt besteht.
An dieser Stelle erscheint der Einsatz von Künstlicher Intelligenz durchaus reizvoll. Hierbei ist nicht der bloße Einsatz dieser Technologie, sondern die Kombination von natürlicher und Künstlicher Intelligenz als zielführend herauszustellen. Um dies zu erreichen, kann durchaus auf Expertensysteme zurückgegriffen werden. Jedoch ist sowohl der Aufwand für die Integration von Daten sowie der Aufwand für die Formalisierung des natürlichen Wissens nicht zu unterschätzen. Ein oft beobachteter Ansatz ist die zwingend notwendige Einbindung von Prozessexperten bei der Entwicklung und Interpretation von Modellen des Maschinellen Lernens (ML-Model). Hierbei fließt das Fachwissen der Prozessexperten in die Entwicklung von Merkmalen, die Auswahl von Methoden sowie die Bewertung und Interpretation der Ausgabe des ML-Modells ein. Dieses gemeinsame Vorgehen von Wissensträgern aus der Prozess-, Daten- und KI-Domäne ist eine notwendige Voraussetzung für eine erfolgreiche Entwicklung und Implementierung von Künstlicher Intelligenz.
Bei diesem Vorgehen ergeben sich jedoch zwei Herausforderungen. Zum einen stehen aufgrund unvollständiger Datenerfassung zu Beginn der Entwicklung eines ML-Modells in vielen Fällen nicht die erforderlichen Daten zur Verfügung. Zum anderen endet die Einbindung der Prozessexperten oft mit dem Ende der Entwicklung des ML-Modells. Der ersten Herausforderung kann durch die Anpassung der Datenerfassung begegnet werden. Dies bedingt jedoch, dass bisher erhobene Daten unvollständig bleiben und damit ihren vollen Nutzen nicht entfalten können. An dieser Stelle kommen wieder die Prozessexperten ins Spiel, welche auf Basis ihres impliziten Wissens möglicherweise die fehlenden Informationen bereitzustellen vermögen. Sollen jedoch umfangreiche Datensammlungen nachträglich von Prozessexperten gesichtet und fehlende Informationen ergänzt werden (Labeling), ergibt sich ein Engpass bei der Verfügbarkeit dieser Personen im Hinblick auf die Aufgabe des Labelings sowie ihrer weiteren Aufgaben im Tages- und Projektgeschäft.
Um eine effektive Nutzung der begrenzt zur Verfügung stehenden Prozessexperten sowie eine langfristige Einbindung dieser in den kontinuierlichen Verbesserungsprozess eines bestehenden ML-Modells zu gewährleisten kann Active Learning eingesetzt werden. Hierbei handelt es sich um einen Ansatz für das Training von ML-Modellen bei dem zunächst eine intelligente Auswahl eines Bruchteils der zur Verfügung stehenden Daten erfolgt. Dieser Ausschnitt der Datenbasis wird anschließend durch die Experten über eine speziell auf den Anwendungsfall und die zu erfassende Information zugeschnittene Schnittstelle analysiert und bewertet. Die dadurch gewonnen Informationen werden für das Training eines ML-Modells verwendet, welches anschließend versucht für bisher nicht bewertete Daten die fehlende Information (das Label) zu vergeben. Hierbei wird nicht der Erfolg des Modells, sondern die Sicherheit des Modells gemessen. Diese Sicherheit bei der Vergabe fehlender Labels ist die Grundlage für die Auswahl weiterer Ausschnitte der Datensammlung, welche anschließend wieder durch die Prozessexperten analysiert und gelabelt wird.
Bei dem initialen Training eines ML-Modells wird den Prozessexperten so ein Mindestmaß an Daten zur Bewertung vorgelegt, welches einen maximalen Nutzen hinsichtlich der Entwicklung des ML-Modells verspricht. Im Hinblick auf die Überwachung und Wartung von ML-Modellen im produktiven Einsatz, kann Active Learning eine Entscheidende Rolle bei der Qualitätssicherung der Entscheidungen des ML-Modells spielen. Durch die Bewertung der Sicherheit mit welcher das ML-Modell eine Entscheidung getroffen hat, können Prozessexperten automatisiert hinzugezogen werden, um eventuelle Fehlentscheidungen frühzeitig zu identifizieren und durch die Korrektur der Entscheidung des ML-Modells zukünftigen Fehlentscheidungen vorzubeugen.