Kämpf um deine Daten. Max Schrems
Чтение книги онлайн.
Читать онлайн книгу Kämpf um deine Daten - Max Schrems страница 8
Natürlich ist davon auszugehen, dass Target nicht nur einen Schwangerschaftsindex, sondern auch unzählige andere solcher Indices für jeden Kunden anlegt. Target hält sich dabei an alle (US-) Gesetze. Der Mitarbeiter räumte gegenüber der New York Times aber ein: »Selbst wenn man sich an die Gesetze hält, kann man Dinge tun, bei denen den Leuten schlecht wird.« Ob Target den betroffenen Leuten entsprechende Gutscheine für Beruhigungstropfen zuschickt, ist nicht überliefert.
Penetrant umworben zu werden kann schon sehr grenzwertig sein. Noch problematischer wird es aber im gegenteiligen Fall, also wenn Sie gewisse Dinge nicht mehr bekommen, weil Ihre Daten analysiert wurden. Wenn Sie keine Gutscheine oder Angebote bekommen, die alle anderen bekommen, weil Sie nicht genug Umsatz bringen, wenn Sie keinen Vertrag bekommen, weil die Analyse Sie als unprofitablen Kunden ausgewiesen hat. Das muss nicht bedeuten, dass Sie nicht zahlen. Vielleicht zahlen Sie einfach nur zu wenig. Vielleicht gehen Sie nicht jedem Werbeversuch auf den Leim. Wenn Sie beispielsweise ein disziplinierter Kunde sind und eben nur die Sonderangebote nutzen, sich aber dann nicht zu großen Käufen hinreißen lassen, dann bringen Sie keinen ausreichenden Profit.
Heute ärgern wir uns, weil wir ohne Kundenkarte irgendwo keine Minus 20% bekommen. In Zukunft werden wir hingegen oft gar nicht mehr wissen, welche Optionen es gibt und was vor uns versteckt wird. So etwa hat der Zahlungsdienst PayPal mit einigen US-Airlines die Kundendaten ausgetauscht. Diese Airlines speichern in ihrer Kundenkartei, dass Sie ein PayPal-Konto haben. Wenn Sie ein Ticket kaufen, werden alle anderen Zahlungsoptionen ausgeblendet, und Sie können nur noch mit PayPal zahlen. Die Unternehmen sparen damit Kreditkartengebühren und haben vermutlich auch einen besseren Tarif von PayPal bekommen. Wenn Sie lieber mit Kreditkarte gezahlt hätten, dann ist das Ihr Problem. Ähnliches gibt es auch mit Kreditinformationen. Wenn Sie als höheres Risiko gelistet sind, können Sie nur noch vorauszahlen, die anderen Optionen werden Ihnen nicht mal mehr angezeigt. Der Vorteil für die Unternehmen: Sie wissen nicht mal, was Sie nicht bekommen.
Zur immer tiefer gehenden Analyse kommt die immer umfassendere Verknüpfung und Wiederverwendung von Daten hinzu. Wie im PayPal-Beispiel werden Daten über den einzelnen Zweck der Datensammlung, über die einzelnen Unternehmen und über alle anderen Grenzen hinweg verknüpft. Durch die Verknüpfung entsteht aus einzelnen Datenpunkten ein eng verwobenes Datennetz zu jeder Person. Wie bei einem Puzzle ergibt erst die Zusammenschau aller Teile das detaillierte Gesamtbild. Die Gesamtheit ist dabei mehr als die Summe der Einzelteile, viel mehr.
Dieser Prozess passiert einerseits über die Verknüpfung Ihren Daten aus verschiedenen Quellen, zum Beispiel bei direkten Kooperationen verschiedener Unternehmen, über Datenhändler und über die Integration von externen Systemen. Andererseits werden Ihre Daten auch mit den Daten anderer Personen verknüpft, die Ihnen irgendwie ähnlich sind oder Rückschlüsse auf Sie zulassen.
Ein Beispiel: Wenn man von Ihnen etwa nur weiß, dass Sie ein gewisses Studium an einer Uni besucht haben, so lassen sich die Informationen aller anderen Personen mit dem gleichen Merkmal mit Ihren Daten verknüpfen. Wenn Sie, wie ich, Rechtswissenschaften studiert haben, sind Sie statistisch gesehen vermutlich finanziell besser ausgestattet, konservativ und, wenn Sie das Studium überlebt haben, vermutlich auch nicht ganz doof. Wenn Sie, wie ich, im 6. Bezirk in Wien wohnen, sind Sie tendenziell finanziell okay ausgestattet, wählen Grün, kaufen Bio-Fleisch und sind ein Bobo oder zumindest nah dran einer zu werden. Wenn Sie 1987 geboren sind, dann sind Sie vermutlich Teil der »Generation Praktikum«, sind finanziell nicht so gut ausgestattet und haben bis heute keinen genauen Karriereplan.
Man sieht also, dass man schon aus drei Informationen mit einer gewissen statistischen Treffergenauigkeit Dinge errechnen kann. Wenn Sie nur die Zahlen 1060, A101 oder 1987 sehen, ist das nicht vorstellbar, aber durch die Verknüpfung mit anderen Personen, die auch als Postleitzahl 1060, als Studienkennziffer A101 und als Geburtsjahr 1987 haben, lässt sich aus diesen mickrigen drei Zahlen ein gutes Bild zeichnen. Das Ganze funktioniert, ohne diese zusätzlichen Informationen vom einzelnen Nutzer einsammeln zu müssen. Die Unternehmen brauchen nur Informationen über eine gewisse Zahl der Personen, die zu einer Gruppe gehören, um auf den Rest hochrechnen zu können. Die einzelne Person weiß nicht einmal, dass sowas passiert und geht daher auch überhaupt nicht davon aus, dass die Postleitzahl mehr als den groben Wohnort verraten kann.
Noch weiter kann man das treiben, wenn Sie beispielsweise ein Profil auf Facebook haben. Facebook braucht nicht mal mehr Ihre Angaben zu Studium, Wohnort oder Geburtsjahr. Durch Ihre Freunde lässt sich auch das ausrechnen, denn tendenziell haben Sie entsprechende Freundesgruppen, die gleich alt sind (Schulfreunde), die das Gleiche studiert haben (Studienfreunde) oder das Gleiche arbeiten (Arbeitskollegen). Über deren Daten lassen sich dann auch Ihre Informationen hochrechnen. Bei E-Mail-Konten oder anderen digitalen Beziehungen ist das natürlich auch möglich.
Das Problematische daran ist unter anderem, dass Daten, die wir irgendwo angeben, für vollkommen unvorhergesehene, absolut unerwartete Berechnungen verwendet werden. Oft sind das auch Sekundärverwendungen, die nichts mit der ursprünglichen Datensammlung zu tun haben. Wenn Sie etwa Ihre Postleitzahl in einem Webshop für die Zustellung hergegeben, haben Sie nie zugestimmt, dass dadurch Ihr vermutlicher Bio-Fleisch-Konsum oder Ihre Kreditwürdigkeit errechnet werden. Wenn Sie jemanden zu Ihrem Adressbuch hinzufügen, gehen Sie nicht davon aus, dass das zur Berechnung Ihres Wohnorts verwendet werden könnte. Das ist ein vollkommen anderer Verwendungszweck, als Sie ursprünglich dachten.
Das Problem erkannten Datenschützer schon in den 1980ern. Daher wurde in unsere Datenschutzgesetze die sogenannte »Zweckbindung« eingefügt. Das bedeutet, dass Daten nur für den jeweiligen Sachzusammenhang verwendet werden sollen und nicht für irgendwas Unerwartetes. Zweckbindung hört sich etwas formalistisch an, das Konzept kennen wir aber auch im täglichen Leben: Wenn Sie zum Arzt gehen und ihm intime Informationen über Ihre Schmerzen beim Stuhlgang geben, dann erwarten Sie implizit, dass diese Informationen nur für die Behandlung verwendet werden. Sie wären empört, wenn der Arzt das am Stammtisch weitererzählt oder wenn er die Daten an ein Pharmaunternehmen weitergibt, das Ihnen eine Testpackung Hämorrhoidenzäpfchen zuschickt. Sie erwarten vollkommen logisch, dass die Information für einen bestimmten, abgeschlossenen Zweck verwendet wird.
Die Zweckbindung, die Sie beim Arzt vollkommen natürlich erwarten, gilt laut Gesetz bei allen Daten, sie wird in der Praxis jedoch weitgehend ignoriert. Unternehmen definieren entweder den Zweck so allgemein, dass ohnehin alles erlaubt ist, oder sie vergessen auf diese Beschränkung überhaupt. Damit ist dann auch sichergestellt, dass alle Daten aus allen Quellen für jeden Zweck analysiert oder verknüpft werden dürfen. Frei nach dem Motto: »Cool, die Daten haben wir eh schon!«, wird einfach alles kreuz und quer verarbeitet und verknüpft. Die Bindung an einen spezifischen Zweck gibt es oft nur am Papier.
Generell sehen wir, dass wir selbst sehr sparsam mit den Informationen sein können, die wir preisgeben. Durch zweckfremde Nutzung, Verknüpfungen mit anderen Daten, statistische Auswertungen und Analysen kann man aber schon aus ein paar wenigen Informationen sehr viel mehr hochrechnen. Diese Systeme sind in etwa soetwas wie ein informationstechnisches Perpetuum mobile. Aus Daten werden immer neue Daten generiert. Daten sind also nicht ein Mal da und liegen dann genau so auf irgendwelchen Festplatten sondern verhalten sich heute wie ein permanent nachwachsender und sich aus sich selbst vergrößernder Rohstoff. Immer größere Massen an Rohdaten, gemeinsam mit immer mehr Verknüpfungen, Analysen und Statistiken erlauben es, den Pool an Informationen aus sich selbst heraus zu vergrößern. Das ist ein Teil des Phänomens, das heute oft mit dem Schlagwort »Big Data« beschrieben wird. Der Leitsatz »Was ich nicht angebe, können sie nicht wissen« ist schon längst