MALMOE

Datenerstellung

Becoming Digital (0x11)

Daten seien das neue Öl, wird oft behauptet. Nur: Von welchen Daten wird da gesprochen? Und wo und wie werden sie erstellt? Schließlich sind Daten nicht automatisch vorhanden. Sie müssen mit Geräten gemessen oder an irgendeiner Stelle abgefangen und gespeichert werden, um sie weiterzuverarbeiten. Dabei können Unmengen an Daten anfallen, wie zum Beispiel bei Experimenten am CERN, von denen nur ein Bruchteil für weitere Analysen nutzbar sind. Andernorts werden hochqualitative und detaillierte Datensätze manuell erstellt, die zwar nicht „big“ aber „smart“ sein können. Um zwei Themenfelder kreisen Debatten in den Digital Humanities immer wieder: die Strukturiertheit von Daten, ohne die wenig Sinn im Datenstrom ausfindig zu machen wäre, und die Notwendigkeit von Datenqualität, da von mangelhaften Datensammlungen abgeleitete Aussagen Gefahr laufen, Störungen zu wiederholen. Für die Umsetzung dieser zwei Aspekte sind digitale Infrastrukturen nötig, in denen Daten erstellt, bearbeitet und genutzt werden. Solche Infrastrukturen sind nicht unbedingt einfach aufzubauen, beeinflussen aber maßgeblich die Datenerfassung und damit den Umfang einer Datensammlung. Schließlich kann die Kontrolle über solche Infrastrukturen nicht nur Deutungshoheit, sondern auch Informationsvorsprung nach sich ziehen. Digitale Infrastrukturen bestimmen die Menge, die Qualität und auch die Struktur der Daten, die dort anfallen, erstellt oder weitergeleitet werden und sind dadurch ein nicht unbedeutendes Machtmittel, über dessen Kontrolle beständig eine kritische Auseinandersetzung stattfinden sollte.

Zugleich könnten datenpolitische Forderungen wie Datentransparenz oder auch Datenprivatheit – zum Beispiel ein weitestmögliches Vermeiden von Datenerfassung – in Infrastrukturen implementiert werden. Der Zustand einer Infrastruktur kann somit etwas über eine Institution aussagen, etwa den jeweiligen Stand und die Folgen der Digitalisierung oder auch, ob ein souveräner und emanzipierter Umgang mit Datenerfassung und -sammlung gepflegt wird. Diesbezüglich hinterlässt die Aufbereitung der Datensituation zu Covid-19 in den unterschiedlichen Ländern bzw. Institutionen einen eher tristen Gesamteindruck. Entweder zählt Datentransparenz nichts, oder der behauptete Digitalisierungsschub ist vielerorts noch nicht angekommen. Das sich selbst als Musterland der Digitalisierung bezeichnende Österreich hat zunächst lange gebraucht, um überhaupt halbwegs brauchbare Daten zu liefern, wobei es bis heute nur bemerkenswert wenige Informationen sind, die am amtlichen Dashboard zu Covid-19 angeboten werden. Unabhängig davon, ob und in welchem Ausmaß dazu Daten gesammelt werden sollen, handelt es sich hier um ein überraschend frühes Stadium einer im Aufbau begriffenen öffentlichen Infrastruktur zu Gesundheitsdaten. Das mag ärgerlich u.a. für die Forschung sein, zugleich ist hier in Zukunft aufmerksam darauf zu achten, wie die Balance gehalten wird zwischen erweiterter Datenerfassung sowie dem Schutz vor Datensammlungen und einer Offenlegungspflicht von vorhanden Daten.