Von Datengetriebenheit und Datendemokratisierung: Data Integration

In meinem letzten Artikel habe ich beschrieben, warum Daten eine wichtige Rolle spielen und wie durch datengetriebenes Arbeiten und Datendemokratisierung ein signifikanter Wettbewerbsvorteil generiert werden kann. Das Fundament dafür ist ein gut aufgestelltes Data-Team. Wir haben festgestellt, dass zwei grundlegende Fragen vor der Gründung eines Data-Teams geklärt sein sollten:

(1) Wie ist das Data-Team organisiert und wo ist es im Unternehmen verortet?

(2) Welche Kenntnisse und Kompetenzen sollte das Data-Team haben?

Wie wir bei Traum-Ferienwohnungen diese Fragen beantwortet haben, war Teil des letzten Artikels.

Mit dem heutigen Artikel möchte ich auf unsere Erfahrungen eingehen, die wir nach einjährigem Bestehen unseres Data-Teams gemacht haben. Unser Fazit aus diesem ersten Jahr: Wir haben viel gelernt, wir sind häufig auf die Nase gefallen, aber wir haben den Grundstein für datengetriebenes Arbeiten und Datendemokratisierung bei Traum-Ferienwohnungen gelegt.

Die größte Erkenntnis, die wir im letzten Jahr gewonnen haben, lässt sich hervorragend durch das folgende Zitat beschreiben: „A surprising number of organizations invest heavily in processing the data, with the hopes that people will simply start creating value from it. This ‘if we build it, they will come‘ attitude rarely works.“ (DJ Patel und Hilary Mason – Data Driven: Creating a culture)

Eines der ersten Projekte des Data-Teams war es, ein Vorhersagemodell zu bauen, mit dem Kunden identifiziert werden können, die in Zukunft ihren Vertrag mit uns nicht verlängern werden (ein sog. customer-churn-model). Ein hochrelevantes Projekt dessen Auswirkungen für das gesamte Unternehmen sofort sichtbar ist. Der Auftrag ist klar und die Lösung liegt – zumindest aus technischer Sicht – auf der Hand. Aufgrund von nicht historisierten und qualitativ geringwertigen Daten, hat das Projekt jedoch deutlich länger gedauert, als zunächst geplant. Dennoch konnten, nach mehreren Monaten, die Ergebnisse präsentiert werden. Alle waren euphorisch über die Erkenntnisse, die gewonnen wurden und die Möglichkeit, Vorhersagen über potenzielle Kündiger zu machen. Die Erkenntnisse über die relevanten Einflussfaktoren auf die Kündigungswahrscheinlichkeit sowie eine konkrete Liste von potenziellen Kündigern wurden vom Data-Team an ein anderes Team übergeben, im festen Glauben, dass das Team damit Gutes vollbringen und für das Unternehmen ein ordentliches Umsatzplus generieren wird. Mit dieser Übergabe war die Arbeit des Data-Teams also erledigt. Doch trotz Anfangseuphorie wurden die Ergebnisse dieses Projektes nicht genutzt, sie verschwanden in der Schublade. Das führte im Endeffekt dazu, dass das Data-Team keinen Mehrwert für das Unternehmen erzeugt hatte.

Es gibt zwei Sichtweisen auf dieses Ereignis: Entweder können wir behaupten unserer Bringschuld nachgegangen zu sein und argumentieren, dass die Verantwortung für die Verwendung des Modells bei dem Team liegt, für das wir dieses Modell gebaut haben. Oder wir sehen die Verantwortung über die Verwendung des Modells bei uns. Allerdings gehen wir dann auch Eingeständnisse von Fehlern unsererseits ein, die Implementierung nicht bis zum Endverbraucher zu Ende gedacht zu haben.

Wir haben uns für Letzteres entschieden. Das führt dazu – und jetzt schließt sich der Kreis zum letzten Artikel – dass sich ein Data-Team eine fundamentale dritte Frage stellen muss:

(3) Wie lässt sich ein Data-Team in die bestehende Organisation integrieren, um nachhaltig Mehrwert für das Unternehmen zu generieren?

Um diese Frage beantworten zu können, müssen wir den Data Science Workflow etwas näher betrachten. Die Schritte eines Data Science Projektes lassen sich sehr gut als Lebenszyklus darstellen. So gibt es bspw. den CRISP-DM (Cross Industry Standard Process for Data Mining), eines der am weitesten verbreiteten Lebenszyklen für Data Science Projekte. Durch unsere Erfahrung haben wir jedoch gelernt, dass wir deutlich stärker auf ein kontinuierliches Feedback und einer starken Beziehung zum Klienten achten müssen. Deshalb arbeiten wir bei Traum-Ferienwohnungen nach einem modifizierten Data Science Lebenszyklus (siehe Abbildung).

Dieses Bild hat ein leeres Alt-Attribut. Der Dateiname ist data-science-lifecycle-modified-900x506.png

Wo immer wir können, arbeiten wir mit dem Klienten zusammen und holen uns Feedback. Das gilt nicht nur in den ersten Punkten „Business Understanding“ und „Data Understanding“, sondern auch für die beiden letzten Punkte „Deployment“ und „Feedback & Improvement“. Die Art und Weise wie Ergebnisse in den Tagesablauf von Mitarbeitern integriert werden, ist ausschlaggebend, ob das Modell verwendet wird. Darüber hinaus ist eine kontinuierliche Weiterentwicklung des Deployments, insb. wenn das Modell als Applikation zur Verfügung gestellt wird, ausschlaggebend um zu bewerten, ob sich ein Mitarbeiter mit dem Tool wohlfühlt. Nur wenn das Modell genutzt wird, entsteht ein Nutzen für das Unternehmen und das Data-Team hat seine Aufgabe erfüllt.

Als ich im November 2018 einen Vortrag über genau diese Erfahrungen auf dem von Axel Springer ausgerichteten Big Data Day gehalten habe, hatte ich zunächst Zweifel über unseren „Fehlschlag“ zu berichten. Gerade weil dieses Learning im Nachhinein betrachtet fast schon als trivial angesehen werden könnte. Da wir bei Traum-Ferienwohnungen eine sehr offene Fehlerkultur haben und dazu ermutigt werden über unsere Erfahrungen – gut oder schlecht – zu berichten, hatte ich diese Zweifel nur für kurze Zeit. Das war auch gerechtfertigt, denn nach der Präsentation haben mich viele Personen darauf angesprochen und mir mitgeteilt, dass sie ganz ähnliche Erfahrungen gemacht haben und heute noch machen. Nicht zuletzt habe ich einige Monate nach der Präsentation erfahren, dass die Mehrheit der Besucher des Big Data Days meinen Vortrag als wertvollsten Beitrag an diesem Tag angesehen haben. Das hat meine Ansicht über die Relevanz des Themas „Integration von Data-Teams“ insgesamt gestärkt und auch dazu geführt, diesen Blogartikel zu schreiben.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.