Data Science wollen, Data Science machen und Data Science können sind doch irgendwie verschiedene Dinge, erkennt so manches Unternehmen über die Zeit. Umso besser, wenn man in realistischem Umfang beginnt, aus Fehlern lernt und mit den eigenen Erfolgen wächst. So entstanden die hier beschriebenen „lessons learned“ eines kommunalen Versorgungsunternehmens.

Kaum ein Artikel über Data Science verzichtet auf die Erläuterung, wie wichtig das Thema in den letzten Jahren geworden ist, wie aktuell die entsprechenden Themen sind und wie dringend praktikable Lösungen gefunden und entwickelt werden müssen, um Unternehmen zu einer Anwendung zu befähigen. Erkannt haben das inzwischen aber viele, ohne es immer wieder zu lesen.

Auch die SWK STADTWERKE KREFELD AG (SWK AG) standen vor der Herausforderung, ein Team aufzubauen und dieses in die Unternehmenspraxis einzubinden. Nach über einem Jahr Pionierarbeit liegen bereits mehrere Erfolge in der Umsetzung vor, was umso positiver zu werten ist, da Data-Science-Projekte heutzutage häufig scheitern, weil ihren Besonderheiten nicht genügend Beachtung geschenkt wird [1]. Dieser Beitrag beschreibt, wie sich die SWK AG dem Thema genähert hat, welche Herausforderungen es zu überwinden galt und welche „lessons learned“ sich zusammenfassend erkennen lassen. Die Erfahrungen aus den ersten Monaten werden rückblickend abgeglichen mit Hilfsmitteln, Konzepten und Ideen, die erst auf dem Weg und in Teilen durch den Kontakt zur Hochschule Niederrhein erkannt und eingesetzt wurden.

Die Stadtwerke Krefeld

Als Umsorger ihrer Kunden kümmert sich die SWK AG mit fast 3000 Mitarbeitern in den Geschäftsfeldern Versorgung (Energie und Wasser), Verkehr (Bus, Bahn, Carsharing, mein SWCAR und KRuiser) und Entsorgung (von der Logistik über das Recycling bis zur Verbrennung) um die Bedürfnisse von bundesweit mehr als 690.000 Energiekunden, über 39 Mio. Fahrgästen und über 1 Mio. Haushalten im Bereich Entsorgung. Mit einem Jahresumsatz von rd. 1,3 Mrd. € zählt die SWK AG zu den größten rein kommunalen Stadtwerken in Deutschland.

Besonders in Krefeld und am linken Niederrhein entsteht so eine Vielzahl an Kundenkontakten. Jedes Mal fallen dabei auch neue Daten an, die für die Abrechnung der erbrachten Leistung erhoben werden. Wie viele kommunale Versorger ist auch die SWK AG seit mehreren Jahren mit kontinuierlich steigenden Kundenerwartungen konfrontiert, ergänzt durch einen starken Wunsch nach Individualisierung. Kunden erwarten, dass die vorhandenen Informationen auch gewinnbringend für sie im Rahmen von (Cross‑)Service und (Cross‑)Selling eingesetzt werden. So ist es den Kunden heute einerseits nicht mehr vermittelbar, dass sie sich an mehrere Stellen wenden müssen, um verschiedene Anliegen mit ihrem Anbieter zu regeln. Sie erwarten vielmehr, dass ihr letzter Kontakt, die gebuchten Produkte und Dienstleistungen sowie ihre Stammdaten bei jedem Kontakt mit dem Unternehmen bekannt sind, wie in einer guten Beziehung Bedürfnisse antizipiert werden und sich in effizienten Kundenkontakten mit Mehrwerten niederschlagen. Auf der anderen Seite sind die Bedürfnisse verfehlende Angebote, nicht individualisierte Standardschreiben oder unpersönlicher Service unerwünscht. Die zur Verfügung stehenden Daten können also dabei helfen, Kunden besser zu verstehen und dadurch Service genauso wie Vertriebsaktionen mit der Pipette, statt mit der Gießkanne auf die Bedürfnisse der Kunden auszurichten [2]. Es ist also nur ein logischer Schluss, festzustellen: Data Science ist wichtig, um die Kundenerwartungen nachhaltiger zu erfüllen, um somit als Unternehmen am Markt weiter bestehen zu können und Marktanteile auszubauen.

Der Startschuss zur Data Science

Die Vorstände der SWK AG Kerstin Abraham und Carsten Liedtke haben sich daher im Jahr 2019 entschlossen, einen Data-Science-Use-Case im Bereich des ÖPNV durch ein Projektteam zu verproben. Dieser Startpunkt war naheliegend – beklagt der ÖPNV doch seit Jahren rückläufige Fahrgastzahlen sowie eine schwierige Deckung der Kosten und steht trotzdem als die Lösung für Klimawandel, mangelnde Parkräume in Innenstädten und neue Stadtkonzepte im Fokus von Politik und Öffentlichkeit. Auch wenn Data Science einen Reiz ausübt, neue Geschäftsfelder zu erschließen – in diesem Fall ergaben sich die Fragestellungen des Use Case somit aus einem bestehenden Geschäftsmodell. Die gleichermaßen einfache wie drängende Frage war also: Wie können neue Kunden für den ÖPNV erschlossen werden?

Zur Beantwortung konnte auf die Erfahrungen aus mehreren Jahrzehnten der Dienstleistungserbringung und des Kundenkontakts zurückgegriffen werden und als Startpunkt für mögliche Analysen wurden unter anderem folgende Hypothesen aufgestellt:

  • Es gibt soziodemografische Unterschiede zwischen Nutzern des ÖPNV und Nichtnutzern.

  • Die Entfernung vom Wohnort zur nächsten Haltestelle hat Einfluss auf die Nutzungshäufigkeit.

  • Die Preiselastizität der Nachfrage ist unterschiedlich in verschiedenen Kundengruppen.

  • Die Form des ÖPNV-Angebots (Bus oder Straßenbahn) hat einen Einfluss auf die Nutzung.

Wenngleich die Untersuchung der Hypothesen und die Identifikation neuer Kundenpotenziale im Mittelpunkt standen, musste im Rahmen des Projekts zunächst überprüft werden, ob mit den vorliegenden Daten und datenschutzrechtlichen Restriktionen diese Fragen überhaupt beantwortet werden können. Zudem stellte sich die Frage, mit welchen Methoden und Organisationsformen Data Science bei der SWK AG über das Projekt hinaus erfolgreich durchgeführt werden könnte.

An dieser Stelle sei bereits ein Teil der Antworten verraten: Projekt, Methodik und Ergebnis haben abschließend überzeugt. Data Science, insbesondere in Form der Data Analytics, ist heute im Unternehmen etabliert und als interne Dienstleistung zentral in der Holding des Konzerns verankert.

Von Aufgaben und Kompetenzen

Zum Start des Projekts waren die zentralen Aufgaben gegeben. Was fehlte, waren Werkzeuge und Menschen. Warum aber sollten die Werkzeuge vordefiniert sein, wenn es doch einen Kasten davon im Data-Science-Umfeld gibt, der zum großen Teil auch noch kostenlos zu haben ist [3]. Mit R, Python und ergänzender, vorhandener Software zur Datenexploration wurden Standardwerkzeuge in den Blick genommen, ohne von vornherein weitere Software auszuschließen. Schwieriger gestaltete sich die Festlegung auf die spezialisierten Anwender. Eine Suche nach den Kompetenzen von Data Scientists führt fast zwangsläufig auf den vielzitierten Dreiklang aus Mathematik/Statistik, IT und Fachwissen [4]. Erst der Mix aus wissenschaftlichen Fähigkeiten und Prozess-Know-how macht das Auswerten von Daten möglich.

So logisch dies klingt, so viele Fragen wirft es in der Umsetzung auf:

  • Wie stark sollen die einzelnen Kompetenzen ausgeprägt sein?

  • Was ist die beste Mischung?

  • Gibt es noch weitere Soft Skills, die benötigt werden, um ein Data-Science-Team zu etablieren?

Ein (zu) einfacher Ansatz wäre es gewesen, drei Personen einzustellen, die je einen der Bereiche besonders gut abdecken. Besteht wenig Raum für falsch eingesetzte Ressourcen, bietet es sich an, zunächst abzufragen, welche konkreten Fähigkeiten verlangt werden. Im Bereich des Methodenwissens sind Programmierfähigkeiten und die Beherrschung notwendiger Tools unabdingbar. Da im Unternehmen in gewissem Umfang bereits kommerzielle Software zur Visualisierung angewendet wurde, war es wünschenswert, diese Fähigkeiten mit auf die „Wunschliste“ zu nehmen.

Domänenwissen war im Unternehmen bereits vorhanden und ist für einen Data Scientist unabdingbar. Erst das Domänenwissen ermöglicht Data Scientists, Fragestellungen richtig zu beantworten und Daten sinnvoll zu interpretieren. Sofern ein Data Scientist noch nicht über das Domänenwissen verfügt, sollte er zumindest in der Lage sein, dieses Wissen zu erwerben. Daher sind neben Methodenwissen auch Soft Skills notwendig, die es Data Scientists erlauben, ein ausreichendes Netzwerk aufzubauen, um sich das Domänenwissen und Prozess-Know-how anzueignen. So führt die Notwendigkeit für ein eigentlich „faktisches“ Domänenwissen zu der Kompetenzanforderung, Soft Skills wie Kommunikationsfähigkeit, Wissbegierde und Motivation aufzuweisen.

Im Rückblick zeigt sich, dass die Überlegungen zwar richtig, aber immer noch recht „hemdsärmelig“ waren. Ein strukturierterer Ansatz ergibt sich unter Verwendung eines Vorgehensmodells, zum Beispiel dem 2020 vorgestellten Data Science Process Model (DASC-PM) [5]. Dieses beschreibt auch ein Kompetenzmodell mit den Kompetenzen „Mathematik/Statistik“, „Informationstechnik“, „Anwendungsbereich“, „Kommunikation“, „Strategie“ und „Management“. Dabei werden die jeweiligen Kompetenzen und deren Relevanz für die verschiedenen Schlüsselbereiche in ein Data-Science-Projekt eingeordnet. Betrachtet man dies beispielhaft für die Aufgabe „Anwendung von Analyseverfahren“ aus dem Schlüsselbereich „Analyseverfahren“ lässt sich das in Abb. 1 dargestellte Kompetenzprofil erkennen.

Abb. 1
figure 1

Kompetenzprofil „Anwendung von Analyseverfahren“ nach Data Science Process Model (DASC-PM) [5]

Im Bereich der „Anwendung von Analyseverfahren“, der für ein Data-Science-Projekt wesentlich ist, werden den Kompetenzen Mathematik/Statistik, Informationstechnik und Anwendungsbereich eine hohe bis sehr hohe Relevanz beigemessen. So lassen sich Kompetenzen und deren Relevanz den verschiedenen Aktivitäten und Schlüsselbereichen besser zuordnen. Eine Anwendung des Kompetenzmodells hätte in diesem Fall die SWK AG dabei unterstützen können, Bedarfe noch deutlicher zu formulieren, was auch zur ersten „lesson learned“ führt: Verwende ein Kompetenzmodell, um Bedarfe präzise zu artikulieren.

Auswahl und Zusammenstellung des Teams

Wenn geklärt ist, was getan werden muss, ist immer noch nicht klar, wer es tut und nach welcher Person nun eigentlich gesucht werden muss. Es zeigte sich früh im Prozess der Suche: Es gibt keine eierlegende Wollmilchsau, es gibt kein „Einhorn“. Vielmehr gibt es mehrere Rollen, die auszufüllen sind und die sich an den Kompetenzen und Aktivitäten entlang recht gut definieren lassen. Auch hier wäre ein früher Blick in das genannte Vorgehensmodell hilfreich gewesen, um sich für die Rollendefinition an den Kompetenzprofilen des „Data Engineers“ und „Data Analysts“ zu orientieren [5]. Bewährt hat sich auch ohne diese Trennung aber eine Case Study als Auswahlinstrument, bei der eine der initialen Fragestellungen des Projektes mit reduziertem Datensatz und vorformulierten Hypothesen zu bearbeiten war.

Entscheidend neben den „harten Kompetenzen“ sind dann aber auch die Fähigkeiten, die sich erst im Auswahlgespräch zeigen und genauso wichtig sind: Lernwille und Einstellung. Das ist keine Data Science spezifische Erkenntnis, dennoch sollten Entscheidungsträger es auch in diesem Gebiet nicht unterschätzen. Langfristige Motivation von hochqualifizierten Mitarbeitern und ein funktionierendes Team sind nicht durch eine Ansammlung von Solokünstlern zu erreichen, sondern durch die Erkenntnis, dass nicht jeder alles kann und die Summe der Menschen in ihren Spezialgebieten „den Data Scientist“ bildet. Zusammenfassend lässt sich raten: Suche nach Menschen, nicht nach Lebensläufen. Teile sie in Rollen ein, die sie auch wahrnehmen können.

Die eigentliche Arbeit

Bei der Vorstellung eines Data-Science-Projekts lohnt sich als Reaktion auf die Darstellung der Projektlaufzeit immer die Frage: „Und wie viel Vorarbeit war vonnöten, damit es in der Zeit funktionierte?“ Auch bei der SWK AG war die Vorarbeit ein entscheidender Faktor – zeitlich und inhaltlich.

Es zeigte sich früh, dass, wer Data Science im Unternehmen implementieren möchte, zunächst Überzeugungsarbeit leisten muss, zum Beispiel bei Management, IT und Fachabteilungen. Die IT als starker Partner kann Hürden wie fehlende Zugänge und Schnittstellen lösen und die notwendige Infrastruktur bereitstellen. Die Fachbereiche liefern das Prozess-Know-how zur korrekten Interpretation und auch vorab zur Definition der richtigen Fragestellungen. Dieser Weg ist manchmal steinig und ein gelegentlicher Rückschlag darf nicht entmutigen. Das Ziel und die Vision eines datengetriebenen Unternehmens weisen die Richtung. Wichtig ist, im Einzelgespräch darzulegen, wie die Prozesse, Entscheidungen und Reaktionen auf Geschehnisse beim jeweiligen Ansprechpartner durch Data Science verbessert werden können.

Als vorteilhaft bei der Umsetzung einer Vision hat sich zunächst eine saubere Bestimmung des Ist-Zustandes erwiesen. Die SWK AG setzt sich als Konzern aus verschiedenen Beteiligungsgesellschaften zusammen, die die Bereiche Versorgung, Entsorgung und Verkehr in Krefeld abdecken. Diese Struktur führt zwangsläufig dazu, dass sich die Systemlandschaft aus vielen Lösungen zusammensetzt und Daten in unterschiedlichen Quellen generiert werden. Um festzustellen, welche wertschöpfenden Analysen zukünftig überhaupt möglich sein können, wurde eine „Datenlandkarte“ erarbeitet: Eine Darstellung von Datenquellen, deren Inhalten und Formen (beispielsweise durch die Bestimmung eines Data Owners sowie von Zugriffsrechten, Datentypen, Strukturen, Aktualisierungsintervallen, Key-Attributen und Schnittstellen). Dabei lag der Fokus des Projektes auf den kundenrelevanten Daten wie Kundenmerkmalen oder Informationen zum Kaufverhalten. Die Integration der fachlich und technisch involvierten Bereiche war dabei essenziell. Das Ergebnis wurde visualisiert und der gesamten SWK AG zur Verfügung gestellt.

Diese Datenlandkarte ist inzwischen ein wichtiger Bestandteil für den Bereich Data Science geworden und bildet eine Basis für zukünftige Data-Science-Projekte. Sie schafft einen dauerhaften Überblick über die Systemlandschaft und die darin enthaltenen Daten und kann so die Zeit zwischen Fragestellung und Erkenntnisgewinn bei Datenanalysen verkürzen. Dabei ist zu erwähnen, dass es sich bei der Datenlandkarte um kein statisches Produkt handelt, sondern diese stetig aktualisiert und angepasst wird.

Neben der Umsetzung im eigenen Team, den Fachbereichen und der IT darf der eigentliche Auftraggeber eines neu einzurichtenden Data-Science-Teams aber nie vernachlässigt werden. Das Management jedes Unternehmens kann und wird nur gutheißen, was einen erkennbaren Mehrwert bringt. Dabei sei „erkennbar“ betont, denn Mehrwert muss nicht nur entstehen, er muss auch so aufbereitet sein, dass er nutzbar und sichtbar wird. Was dem Data Scientist also in seiner Umgebung schlüssig erscheint, ist damit noch nicht zwingend auf Entscheiderebene anwendbar. Es braucht gute und sinnvoll eingesetzte Visualisierungs- und Kommunikationskompetenz daher nicht nur für die Analysen selbst, sondern auch, um die Ergebnisse verständlich und nutzbar zu machen [6]. Neben der für alle Projekte im Bereich der Wirtschaftsinformatik also bekannten Erkenntnis, dass IT und Fachabteilungen wertzuschätzen und einzubinden sind, ergibt sich als „lesson learned“ der Data Science: Visualisieren, kommunizieren und erklären sind essenziell für die Nutzbarmachung der Analysen und die Akzeptanz der Arbeit und ihrer Ergebnisse.

Nachhaltige Verankerung

Was einmal funktioniert, muss nicht wieder funktionieren. Ein Data-Science-Team entwickelt sich weiter – auf individueller wie auf übergreifender Ebene. Es kristallisieren sich innerhalb des Teams Rollen und Verantwortlichkeiten heraus, die auf den Stärken und Expertisen basieren und unterschiedlich in die Arbeit eingebracht werden können.

Damit Verantwortlichkeiten über die Teamgrenze hinaus aber auch nach innen klar abgegrenzt und definiert werden können, bietet sich die Einführung sogenannter Businesspartner an. Jedes Teammitglied fungiert dabei als ein Businesspartner für einen konkreten Fachbereich. Die Businesspartner in einem Data-Science-Team stehen den verschiedenen Fachbereichen dann als direkte Ansprechpartner zur Verfügung, können Anfragen zentral bündeln und an das Data-Science-Team weitergeben. Der Businesspartner wirkt als Bindeglied zwischen Data-Science-Team und dem Fachbereich, was die Kommunikation und Zusammenarbeit vereinfacht. Die grundlegende Idee dahinter ist im Kontext der Datenanalyse nicht neu und findet sich – ebenso wie die folgende Erkenntnis – bei vielen Überlegungen zur organisatorischen Verankerung von Management-Entscheidungsunterstützung wieder [7].

Entscheidend ist auch die Festlegung von Selbstverständnis und Vorstandsauftrag. Das Data-Science-Team der SWK AG ist keine Konkurrenz zu etablierten Funktionen, sondern ein kompetenter Unterstützer, der im Bedarfsfall oder proaktiv die Arbeit der Fachbereiche und Konzernfunktionen ergänzt und im Optimalfall erleichtert. Dazu bedarf es immer wieder auch des Domänenwissens und Expertenwissens der weiteren Unternehmensfunktionen. Nur das harmonische Zusammenspiel ermöglicht es einem Data Scientist, die Dienstleistung für das Unternehmen zu erbringen, die er am besten kann: Fragen stellen und mit Daten beantworten. Um dies sicherzustellen, sollte, wie eingangs erwähnt, auch klar definiert sein, ob es das Ziel ist, mit Data Science bestehende Geschäftsfehler weiter zu verbessern oder neue Geschäftsfelder zu erschließen. Für ein Data-Science-Team findet sich daher bei allem Glauben an die eigene Kompetenz und Kreativität zum Abschluss folgende „lesson learned“: Für Teams gilt die gleiche Regel wie für Einzelpersonen in Teams: Du schaffst es nicht allein, also mach es nicht allein.

Zusammenfassung

Inhaltlich lässt sich festhalten: Alle oben genannten Hypothesen über den ÖPNV konnten bestätigt werden. Die gewonnenen Erkenntnisse dienen fortan zur Formulierung von Zielen, Strategien und Maßnahmen und haben die Effizienz der eingesetzten Mittel im Umgang mit den Kunden deutlich verbessert (mit der Pipette statt mit der Gießkanne). Der Aufbau von Data-Science-Teams ist spannend, notwendig und mit vielen Herausforderungen verbunden. Die vorliegenden „lessons learned“ sind das Ergebnis eines gleichermaßen anstrengenden wie erfolgreichen Prozesses. Dass die SWK AG nicht die Ersten und nicht die Letzten sind, die mit den Herausforderungen, Erwartungshaltungen und manchmal noch nicht konkreten Konzepten der Data Science zu kämpfen haben, zeigt sich spätestens, wenn man andere Erfahrungsberichte liest [6, 8]. Wenn auch jedes Unternehmen im Einzelfall für sich entscheiden muss, wie es damit umgeht, lohnt es sich immer, aus den Erfahrungen anderer zu lernen und sich Partner zu suchen, die gute Ideen mitbringen – seien es andere Unternehmensteile, andere Partner im Netzwerk oder die Hochschulen mit ihrem Fundus an jungen Talenten, wissenschaftlichen Methoden und praktisch anwendbaren Erkenntnissen.

Handlungsempfehlungen

Verwende ein Kompetenzmodell, um Bedarfe präzise zu artikulieren.

Suche nach Menschen, nicht nach Lebensläufen.

Teile Teammitglieder in Rollen ein, die sie auch wahrnehmen können.

Zusammenfassung

In vielen Unternehmen besteht noch eine gewisse Unsicherheit darüber, welche Kompetenzen man benötigt, um Data Science betreiben zu können.

Visualisieren, kommunizieren und erklären sind essenziell für die Nutzbarmachung der Analysen sowie die Akzeptanz der Arbeit und ihrer Ergebnisse.

Für Teams gilt die gleiche Regel wie für Einzelpersonen in Teams: Du schaffst es nicht allein, also mach es nicht allein.