Data Science. Michael Zimmer
Чтение книги онлайн.
Читать онлайн книгу Data Science - Michael Zimmer страница 22
Die AddressFactory3 der Deutschen Post ist ein Beispiel für ein Data-as-a-Service-Datenprodukt. Firmen können ihre Adressdaten mit denen der Deutschen Post abgleichen und dadurch eine höhere Datenqualität in ihren eigenen Adressbeständen erreichen.
Medienagenturen: Allokation der Werbebudgets
Ein Beispiel für die Nutzung von Data as Insight – verbunden mit einem dazugehörigen Geschäftsmodell – ist das Angebot vieler Medienagenturen, das Management der Werbeetats zu übernehmen. Auf Basis von Werbeeffizienzkriterien werden die einzelnen Kanäle, zum Beispiel Online, TV, Zeitschriften, in unterschiedlich starkem Maß bespielt und die Werbebotschaften angepasst. Daten werden hier dazu genutzt, ein bestehendes Werbebudget optimal einzusetzen.
Abb. 4–2Datenprodukte werden in zweiseitigen Märkten angeboten.
4.2.3Herausforderungen des Produktmanagements für Datenprodukte
Wenn man sich aus Produktmanagementsicht mit Datenprodukten auseinandersetzt, müssen verschiedene Aspekte des Produktmanagements neu gedacht werden, wie nachfolgende Beispiele zeigen (siehe auch [Davenport & Kudyba 2016]):
1 Dazu zählt zunächst die Frage: Wer sind die Kunden, für wen wird das Produkt gebaut? Dabei kann der zahlende Kunde ein ganz anderer sein als der Hauptnutzer.
2 Warum nutzt der Kunde das Produkt und welches Wertversprechen motiviert ihn, es zu nutzen? Nicht alle Wertversprechen von Daten führen auch zu einer Zahlungsbereitschaft.
3 Für welche Datenprodukte ist ein Kunde bereit, Geld zu bezahlen? Dies steht natürlich in direktem Zusammenhang mit dem Wertversprechen.
4 Insbesondere für die Fälle, in denen der Kunde nicht bereit ist, für die Nutzung zu bezahlen, gilt es herauszufinden, für welche Datenprodukte der Kunde bereit ist, den Anbieter auf andere Art (z.B. Nutzung) zu entlohnen?
5 Wie stellt man die Vollständigkeit des Angebots sicher und gewährleistet, dass die Nutzung durch den Kunden tatsächlich zu einer Verbesserung des Angebots führen kann?
4.3Digitale Produktentwicklung
Das hier vorgestellte Vorgehensmodell zur Entwicklung von Datenprodukten bedient sich an verschiedenen Stellen bei etablierten Vorgehensweisen aus der digitalen Produktentwicklung. Im Folgenden geben wir einen Einblick in die wesentlichen Ansätze und begründen, warum die Erstellung von Datenprodukten an einigen Stellen eine besondere und veränderte Methodik erfordert.
4.3.1Produktmanagement
Das Produktmanagement (PM) ist eine etablierte Disziplin, die sich in der Regel um die generelle strategische und technische Ausrichtung und die Prozesse innerhalb des Produktlebenszyklus kümmert [Smith & Reinertsen 1997; Herrmann & Huber 2013]. Klassisch werden im PM physische Produkte betreut. Das Produktmanagement hat dadurch oft eine vermittelnde Rolle zwischen der Produktentwicklung, der Produktion, dem Service und nicht zuletzt der Unternehmensleitung. Die Produktmanagementmethoden für das Management digitaler Produkte sind in letzter Zeit angepasst worden [Cagan 2008; Pichler 2016; Banfield et al. 2017]. Die Möglichkeiten, Produktänderungen quasi kontinuierlich an den Kunden ausliefern, Produktmerkmale in A/B-Tests auf Basis von Daten vergleichen oder Produkteigenschaften personalisieren zu können, stellten neue Herausforderungen an das PM, die in früheren Vorgehensweisen wenig Berücksichtigung fanden. Bei der Definition von Datenprodukten muss zusätzlich bedacht werden, dass Informationen nur bestimmte Value Propositions erfüllen können und dass die Nutzung des Angebots wiederum Daten produziert, die wertstiftend eingesetzt werden sollten.
4.3.2Agile Entwicklung
Innerhalb der Softwareentwicklung hat sich die agile Entwicklung in den letzten Jahren als bevorzugtes Vorgehensmodell etabliert. Kurze Feedbackzyklen innerhalb kleiner Teams und die Möglichkeit, schnell auf sich ändernde Anforderungen zu reagieren, sind wesentliche Vorteile der agilen Entwicklung. Die Abläufe, die durch Scrum [Schwaber & Beedle 2002] oder Kanban definiert werden, finden dabei häufig Anwendung. Nach Scrum werden kurze Feedbackzyklen innerhalb des Teams beispielsweise durch das Daily Scrum und die Retrospektive am Sprint-Ende realisiert. Ein inkrementelles Vorgehen und die Autonomie des Teams sind dabei Voraussetzungen für die effektive Nutzung von Scrum. Für die Entwicklung von Datenprodukten schlagen wir auch die Nutzung agiler Prinzipien vor. Am Beispiel von Google Recaptcha zeigte sich allerdings, dass Datennutzung und Datengenerierung weit auseinanderliegen können. Dies hat Einfluss darauf, wie Autonomie für Datenproduktteams erzeugt werden kann. Weiterhin kann der Erkenntnisgewinn aus Daten sehr viel Zeit in Anspruch nehmen, wodurch die Definition des Inkrements zu neuen Herausforderungen führt.
4.3.3Lean Startup
In der Wissenschaft ist das erkenntnistheoretische Prinzip der Falsifikation von Karl Popper beschrieben worden. Die Anwendung dieses Prinzips auf die Produktdefinition, insbesondere von Start-ups, hat Eric Ries eindrucksvoll umgesetzt [Ries 2011]. Jede Produktdefinition impliziert eine Hypothese bezogen auf ein bestimmtes Kundenproblem. Durch die explizite Formulierung von Hypothesen und deren Validierung mit Kunden können die Erfolgsaussichten für eine erfolgreiche Produkteinführung stark gesteigert werden. Eric Ries beschreibt, wie man schrittweise mit kleinen Kundengruppen ein besseres Verständnis für ein Kundenproblem erlangen kann. Für die Definition von Datenprodukten eignet sich dieses Vorgehen ebenfalls. Gerade weil die Entwicklung ausgefallener Algorithmen oft sehr anspruchsvoll und damit zeitaufwendig ist, lohnt es sich, durch frühes Feedback durch den Kunden den potenziellen Mehrwert eines Datenprodukts einschätzen zu können.
4.3.4Data Science
In den Kapiteln 5 und 7 werden unterschiedliche Methoden der Data Science im Detail vorgestellt. Daher soll hier nur der Bezug zu dem Vorgehensmodell CRISP-DM [Shearer 2000] hergestellt werden. CRISP-DM beschreibt, wie Data Scientists vorgehen können, um zunächst ein Geschäfts- und Datenverständnis zu entwickeln, im Anschluss daran die Daten aufzubereiten und zu modellieren, damit diese dann in der Evaluationsphase – bezogen auf das zu lösende Business-Problem – bewertet werden können. Nach erfolgreicher Lösung des Problems kann dieses dann bereitgestellt werden. Der Prozess ist in ein iteratives Vorgehen eingebettet. Durch die hier vorgeschlagene Einbettung der Data Science in die Produktentwicklung können wir stärker auf den Kundennutzen fokussieren und insbesondere Zielsetzungen für inkrementelle Schritte ableiten. Wie wir später sehen werden, ist dies von entscheidender Bedeutung, wenn das Optimieren eines Algorithmus unvorhersehbar viel Zeit in Anspruch nimmt.
4.3.5Data-centric Business Models
Ein