Daten-Scaffolding mit Tableau Prep: Zeilen erstellen für fehlende Datumswerte

Manchmal sind die Daten, die wir haben, an sich nicht ausreichend für die Analyse die wir damit machen wollen. Dazu muss man neue Zeilen oder Spalten behelfsmäßig in die Daten einbauen. Da wir hier eine Art Baugerüst um unsere Daten herum erstellen, um diese Aufzufüllen, nennt man diese Methode Data Scaffolding. In Tablau Prep gibt es dazu ein paar Möglichkeiten, von denen ich hier eine vorstellen möchte.

Kurze Info vorab zum besseren Verständnis: In Tableau und Tableau Prep werden Spalten als Felder bezeichnet. Ich verwende hier beide Begriffe.

Zeilen erstellen

Ein Beispiel: Bei einer Zeitreihenanalyse haben wir z.B. eine Spalte mit Messwerten und eine Spalte mit bestimmte Datumspunkten, zum Beispiel ein Messwert pro Tag. Häufig hat man nicht für jeden gewünschten Datumswert einen entsprechenden Messwert, weil nicht regelmäßig ein Wert erhoben wurde. Falls das aber für die Analyse erforderlich ist, benötigt eine kontinuierliche Datumsspalte. Tableau Prep hat dazu die Funktion "Zeilen erstellen", mit der man die fehlenden Werte einfach erstellen kann.

Achtung: Die Funktion Zeilen erstellen funktioniert nur mit Datumswerten. Falls es nicht funktionieren sollte, könnte es auch daran liegen, dass der Datumstyp als Datum & Uhrzeit definiert ist, was bei Datumswerten der Standard in Tableau Prep ist. Dieses lässt sich leicht im Vorherigen Schritt korrigieren.

Abb. 1: Neue Zeilen im Workflow
Abb. 2: Wertebereich aus zwei Feldern

Einstellungen

Wir können die Werte auf zwei Arten auffüllen.

1) Wertebereich aus zwei Feldern

Das wendet man an, wenn man zwei Daten hat, zwischen denen Daten aufgefüllt werden sollen (Abb. 2). Es wird dazu ein neues Feld erstellt. Man muss das Inkrement angeben zu dem die Daten aufgefüllt werden sollen, z.B. jeder Monat. Spannend ist hier die Einstellung zu den neuen Werten. Da Tableau jetzt neue Zeilen generiert geschieht das natürlich für alle Spalten. Hier kann man entscheiden, welche Wert die neuen Zeilen haben sollen. Es gibt hier genau drei Optionen:

  • "NULL"
  • "NULL oder Zero"
  • "Aus vorheriger Zeile kopieren"

Die zweite Option bedeutet, dass Strings mit "NULL" aufgefüllt werden und Zahlen mit einer "0". Es gibt leider keine weiteren Optionen die Daten aufzufüllen mit bestimmten Durchschnittswerten, oder aus der nachstehenden Zeile zu kopieren.

Abb. 3: Wertebereich aus einem Feld

2) Werte aus einem Feld

Dieses wendet man an, wenn man eine Zeitreihe hat, bei der nicht zu jedem Zeitpunkt Daten vorhanden sind. Wie in Abb. 3 gezeigt, wählt man dazu eine Spalte aus. Man kann einen Start- und Endwert definieren, wobei das in den meisten Fällen den gesamten Bereich der in der Spalte aufgeführten Daten sein wird. Man kann ein neues Feld erstellen, ansonsten wird das vorhandene Feld aktualisiert. Auch hier muss man das gewünschten Inkrement angeben und welche Werte in die neuen Zeilen eingetragen werden sollen.

Mein persönlicher Eindruck

Neue Datumszeilen zu erstellen in Tableau Prep geht sehr schnell und einfach! Es gibt zwar im Vergleich zu anderen Tools Einschränkungen was die Imputation der Daten (das Auffüllen der neu entstandenen Zeilen) angeht, ist aber für die meisten Anwendungen mehr als ausreichend.

Author:
Laura Brylka
Powered by The Information Lab
1st Floor, 25 Watling Street, London, EC4M 9BR
Subscribe
to our Newsletter
Get the lastest news about The Data School and application tips
Subscribe now
© 2026 The Information Lab