Back to top

Interpretierbare KI ist ein reales Business-Problem, kein akademisches!

In vielen Bereichen unserer datengetriebenen Gesellschaft werden Entscheidungen bereits von KI-Systemen getroffen. Diese müssen nicht nur rechtlich nachvollziehbar sein – geregelt durch die DSGVO – sondern auch ethisch und wirtschaftlich, im Interesse aller Stakeholder. Ist die Absage eines Kreditantrags rational begründet oder diskriminierend? Welche Patientendaten erhöhen ein Krankheitsrisiko besonders? Soll eine Filiale aufgrund der Vorhersage eines KI-Modells geschlossen werden, oder lohnt es sich, das Sortiment umzustellen?

Derartige Beispiele motivieren den ersten Teil der Überschrift. Der zweite ist etwas provokant formuliert, denn die Werkzeuge zur Lösung des Problems muss zunächst die (Daten-)Wissenschaft liefern. Die Theorie hinter XAI (eXplainable AI) ist umfangreich und verstreut. Eine sehr gute Erklärung der Erklär-Methoden liefert Christoph Molnar in seinem Guide “Interpretable Machine Learning“.

Darin wird zunächst definiert, was eine gute Erklärung eines Entscheidungsprozesses ausmacht:

  • Sie sollte selektiv sein, also besonders wichtige Attribute (Features) hervorheben.
  • Sie sollte kontrastierend sein, „bekomme ich den Kredit doch, wenn ich Eingabe X ändere?“.
  • Sie sollte auf den Empfänger zugeschnitten, also sozial sein.

In dem Buch werden zunächst modell-spezifische Erklärungen vorgestellt, immer begleitet von durchgerechneten Beispielen für reale Datensätze. Diese haben den Nachteil, dass sie nicht mithalten, wenn das KI-Modell ausgetauscht wird.

Modell-agnostische Methoden dagegen sind universell einsetzbar. Sie erfordern lediglich den Zugriff auf die Vorhersage Y zur Eingabe X, sowie teilweise eine Kenntnis der Trainingsdaten, oder zumindest ihrer realen Verteilung. Diese Methoden können entweder global angewendet werden, z. B. bewertet “permutation feature importance” den Einfluss eines Attributs, indem seine Werte über den gesamten Datensatz zufällig gemischt werden. Werden die Ergebnisse dadurch wesentlich schlechter, dann ist das Attribut wichtig.
„Shapley Values“ liefert dagegen Erklärungen einzelner Instanzen, basierend auf einem soliden spieltheoretischen Ansatz: Wieviel trägt jeder Spieler (jedes Feature) zum Gewinn (zur Vorhersage des Modells) bei?
„Counterfactual explanations“ sind lokale Gegenbeispiele und eignen sich für eine Was-wäre-wenn-Analyse (What-If). Sie berechnen, welche minimalen Anpassungen der Eingabe das Ergebnis umkehren bzw. stark beeinflussen.

Doch wie kann man diese fortgeschrittenen Algorithmen, ohne vorheriges Studium in Data Science und Programmierung, in der Praxis einsetzen? Ein weiteres Problem liegt in der Diversität realer Datensätze, sie sind nicht immer uniform strukturiert, bestehen aus verschiedenen Datentypen, sind numerisch, kategorisch, enthalten auch freie Texteingaben oder Bilder.

Viele AI-Cloud-Plattformen haben das Problem erkannt und bieten Antworten, die auf eine möglichst breite User Schicht zugeschnitten sind. „DataRobot bietet beispielsweise einen End-2-End-Service-Ansatz. Angefangen bei der automatischen Datenaufbereitung, die für viele schon ein unüberwindbares Hindernis darstellt“, weiß Dr. Thomas Hübner. „Über das Training von konfigurierbaren KI-Modellen oder im Autopiloten-Modus gelangt man schließlich zu grafisch aufbereiteten Erklärungen, die auf modell-agnostischen Methoden basieren. Der User muss nicht mehr arglos einer einzigen Zahl als Ergebnisdarstellung vertrauen, er kann sich das Modellverhalten global oder auch bis ins Detail aufgeschlüsselt erläutern lassen“, erläutert der Data Scientist weiter. Damit werden bessere, nachvollziehbare Business-Entscheidungen möglich und die KI wird nach und nach den Mythos der undurchschaubaren Black-Box los.

EVACO setzt sich zum Thema Data Science mit DataRobot seit Ende 2019 auseinander und erweitert so erfolgreich anwendergesteuerte Business Analytics-Lösungen um Predictive Modeling und Machine Learning.

EVACO ist PlatformManager Partner of the year 2021

Das Kickoff 2022 konnte zwar nur in einem sehr kleinen Rahmen stattfinden, dennoch kamen Jeroen Gerritsen und Uco van der Weerd von PlatformManager Ende Januar zum Partnermeeting ins Duisburger Office und verzichteten auf eine weitere Websession. Überraschend und daher umso freudiger wurde an diesem Tag der Partner of the year Award für 2021 höchstpersönlich an EVACO überreicht.

Eine wachsende Qlik Implementierung zu managen stellt viele Unternehmen vor eine große Herausforderung. Denn bei lückenhafter oder fehlender Dokumentation bricht im Hinblick auf die Applikationsentwicklung schnell das Chaos aus. In größeren Teams, aber auch sobald die zeitliche Komponente zum Tragen kommt und Änderungen mehrere Monate zurückliegen, fällt es schwer den Überblick zu behalten, was, wann, in welcher Version, im Skript oder im Frontend angepasst wurde.

Mit dem PlatformManager kann man nachvollziehen, in welcher Version die Applikation vorliegt, dabei werden alle einzelnen Instanzen detailliert angezeigt. Da in der Zusammenarbeit von Entwicklungsteams Versionsmanagement und kontrollierte Rollouts besonders wichtig sind, setzt EVACO seit 2015 auf den PlatformManager. Das Tool für BI Lifecycle Management & Application Governance spielt im ganzheitlichen Lösungsansatz rund um Qlik daher eine zentrale Rolle. Den ‚Partner of the year Award 2021‘ erhält EVACO nun im zweiten Jahr in Folge und bestätigt die ausgezeichnete Zusammenarbeit zwischen dem Softwareberater und dem niederländischen Hersteller.

Zurückblicken können die Kooperationspartner auf zahlreiche umgesetzte Projekte, einen permanenten Austausch und aktive Zusammenarbeit in der Weiterentwicklung der Software. Mittlerweile gestalten über 200 Unternehmen ihre Entwicklungsprozesse transparent, sicher und nachhaltig mit dem PlatformManager. Tägliche Herausforderungen wie fehlende Nachvollziehbarkeit von Daten und Berechnungen, hohe manuelle Aufwände sowohl in der Dokumentation als auch in der zentralen Absicherung von Entwicklungsprozessen vor Veröffentlichung der Applikationen und extrem lange Entwicklungszeiten, können mit dem Einsatz des Tools gelöst werden.

Ziel ist es, mit dem PlatformManager auf Grundlage guter Applikationen die richtigen Entscheidungen zu treffen. Funktionen wie Multi Development, Version Control, Data Lineage. Difference Analysis, Development und Deployment unterstützen den Anwender dabei, dieses Ziel zu erreichen.

Never stop Learning – Chancen und Ideen durch die Kooperation mit Hochschulen

Als besonders effektiv gilt das Modell ‘Learning by Doing‘. Das Gelernte soll somit unmittelbar in der Praxis angewendet werden. Die Möglichkeit dazu ist allerdings oft nicht gegeben und so manifestiert sich das theoretische Wissen nicht hinreichend. Bereits seit einigen Jahren arbeitet EVACO eng mit verschiedenen Hochschulen wie der Hochschule Rhein-Waal, der Universität Duisburg-Essen und der TU Dortmund zusammen und bietet Studierenden unter anderem in gemeinsamen Workshops die Gelegenheit, praxisnah zu lernen.

„An der Hochschule Rhein-Waal legen wir großen Wert auf eine praxisnahe Ausbildung. Business-Intelligence-Anwendungen gehören in den meisten Unternehmen und inzwischen auch in Teilen der öffentlichen Verwaltung zum Alltag. Die Fortschritte im Bereich der Künstlichen Intelligenz (KI) sind beachtlich und machen die Anwendung immer leichter. In den Studiengängen Verwaltungsinformatik – E-Government und Medieninformatik lernen die Studierenden in Workshops den Umgang mit Self-Service-BI-Lösungen und entwickeln eigenständig erste KI-gestützte Analysen. Wir freuen uns sehr, diese Workshops gemeinsam mit Praxispartnern wie EVACO durchführen zu können“, erläutert Timo Kahl, Professor für Wirtschaftsinformatik an der Hochschule Rhein-Waal.

Frei nach dem Ansatz des lebenslangen Lernens profitiert auch der Duisburger Softwareberater von der Zusammenarbeit, denn die Studierenden bringen aus ihrem Blickwinkel vollkommen andere Fragestellungen ein. Daraus entwickeln sich neue Ansätze und Ideen für weitere Projekte. Besonders in Erinnerung geblieben, ist Geschäftsführer Alexander Willinek an das an der Hochschule Rhein-Waal gemeinsam durchgeführte #datatalk meetup. Studierende beteiligten sich beim Analytics User Group Treffen der EVACO 2018 mit einem eigenen Beitrag und stellten im Anschluss mit dem FabLab die Hightech-Werkstatt am Campus in Kamp-Lintfort, vor. „Die technische Ausstattung der Hochschule ist wirklich beeindruckend. Zudem begeistert mich das Engagement der Lehrkräfte und Studierenden an der HSRW.“

Inspiriert durch die humorvolle Darstellung der EVACO Fußball-WG beim #datatalk congress 2021, beim EM-Tippspiel durch die Nutzung von Daten bessere Ergebnisse zu erzielen, entstand die Idee eines weiteren Projektes an der Hochschule Rhein-Waal. In einem zweitägigen Workshop sollten die Studierenden die Benutzung der Tools Qlik Sense® als Business-Intelligence- und DataRobot als Artificial-Intelligence-Plattform und deren übergreifender Nutzen in direkter Anwendung nähergebracht werden.

Grundlage stellte der Datensatz von kaggle.com dar, bei dem es sich um UK-Gebrauchtwagenpreise aus dem Jahr 2020 handelt. Dieser wurde um Neuwagenregistrierungen in UK erweitert, sodass komplexere Analysen möglich waren. Ziel des ersten Workshop-Tages war es, einen Datensatz in Qlik zu laden und dort deskriptiv zu analysieren. Dabei sollten die klassischen Herausforderungen bei der Datenmodellierung exemplarisch gezeigt werden. Zunächst wurden die Studierenden vor Datenprobleme gestellt, die sie gemeinsam lösen konnten, um ein BI-geeignetes Datenschema nach Qlik Sense® zu laden. Die darauffolgende Erstellung verschiedener Visualisierungen zur Beantwortung erster Fragen zeigte den Studierenden den Einstieg in den Datensatz. Am Ende des ersten Tages stand den Studierenden ein Qlik Sense® Dashboard zur Verfügung, in welchem die Daten allgemein analysiert, Teile der Datensätze einander gegenübergestellt und die Gebrauchtwageninformationen passend für DataRobot exportiert werden konnten.

Am zweiten Workshop-Tag wurden die aus Qlik Sense® exportierten Daten in DataRobot geladen und ML-projektrelevante Analysen vertieft. Hierbei konnten verschiedene Konzepte des Data Science Hands-on am Beispiel der Gebrauchtwagenverkäufe den Studierenden vermittelt und neben der theoretischen Idee, eine praktische Anwendung diskutiert werden. Nachdem DataRobot ohne manuelle Eingriffe erfolgreich Modelle gerechnet hatte, sind weitere Bereiche besprochen worden. Dies umfasste sowohl klassisches Data Preprocessing, aber auch Möglichkeiten zur Interpretation von fertigen Modellen, den Einfluss einzelner Features sowie deren Ausprägungen. Anschließend wurden nach einem Feature Engineering neue Modelle gerechnet, sodass im Nachgang, das für den Use Case beste Modell, produktiv gesetzt werden konnte. Um den gesamten Prozess von den Rohdaten über die Analyse bis zur Preisschätzung darzustellen, entwickelten die Studierenden außerdem eine Applikation zur Dateneingabe mit anschließendem Konsum und Analyse der Schätzungen mit DataRobot ohne Programmieraufwand.

„Die Workshop-Tage waren für alle Beteiligten ein voller Erfolg.“, erzählt Matthias Wiciok, Managing Consultant bei EVACO. „Wir haben bereits konkrete Überlegungen entwickelt, diese Veranstaltung für weitere Interessierte zu wiederholen und sprechen auch darüber, ein gemeinsames Projekt durch die Studierenden durchführen zu lassen oder gar einen Hackathon zu veranstalten.“, so der Teamlead des AI Analytics Teams weiter.

Seien Sie dabei! Hier finden Sie unsere Veranstaltungen 2022.