Promotion - entgeltliche Einschaltung

Bessere Prognosemöglichkeiten durch aktuellere Daten

  • Mag. Manuela Lenk ist Bereichsleiterin Registerzählung in der Direktion 
Bevölkerung der Statistik Austria
    foto: statistik austria

    Mag. Manuela Lenk ist Bereichsleiterin Registerzählung in der Direktion Bevölkerung der Statistik Austria

Mag. Manuela Lenk (Statistik Austria) über Herausforderungen der Datenauswertung für die kommende Registerzählung

Die Volkszählung im nächsten Jahr wird nicht mehr als Fragebogenerhebung durchgeführt, sondern als Registerzählung. Aus über 40 Datenbanken werden anonymisierte Daten an die Statistik Austria zur Auswertung geliefert – in strukturierten oder unstrukturierten Dokumenten. Aus diesem Berg von Informationen müssen die relevanten Daten, so genannte Merkmale, für die Analysen gewonnen werden.

Frage: Wie ist der Vorbereitungsstand für die Registerzählung im kommenden Jahr?

Manuela Lenk: Das Registerzählungsgesetz sah mit dem Stichtag 31.10.2006 eine Probezählung vor. Die ist wie die Registerzählung als Vollerhebung gelaufen. Das Ziel war es, das Instrument Registerzählung zu evaluieren und festzustellen, ob es überhaupt funktioniert. In nordischen Ländern dauerte der Übergang von der Volkszählung zur Registerzählung bis zu 30 Jahre. In Österreich haben wir den Turbo eingeschaltet.

Mit der Probezählung haben wir die entsprechenden Datenbanken aufgebaut. Im Abschlussbericht an die Bundesregierung konnten wir berichten, dass sich das Instrument bewährt hat und wir die Volkszählung 2011 als Registerzählung durchführen können.

Da die Ergebnisse sehr gut waren, hat sich in einem zweiten Schritte ergeben, dass die Daten bereits für den Finanzausgleich herangezogen werden. Das heißt, wir machen jedes Jahr eine so genannte Mini-Registerzählung, in der wir die Bevölkerungszahl feststellen. Das ist das wichtigste Ergebnis, mit dem der Finanzausgleich vom Bund an die Länder und Gemeinden erfolgt.

Frage: Aus welchen Quellen erheben Sie die Informationen?

Manuela Lenk: Bei der Registerzählung erheben wir alle Merkmale, die wir auch bei traditionellen Volkszählungen erheben. Da geht es um Informationen zur Erwerbstätigkeit, zu Familien und Wohnungen. Wir haben acht Basisregister, zum Beispiel das Zentrale Melderegister, das Register des Hauptverbandes der Sozialversicherungsträger, das AMS, das Unternehmensregister, das Gebäude- und Wohnungsregister. Daneben gibt es kleinere Vergleichsregister. Insgesamt sind es über 40 Datenquellen. Das ist natürlich eine große Herausforderung. Um den Datenlieferanten das Leben zu erleichtern, schreiben wir kein bestimmtes Datenformat vor. Wir haben ganz kleine Datenlieferanten, zum Beispiel Krankenfürsorgeanstalten, die nur 90 Personen melden. Da können wir nicht verlangen, dass die Daten in ein bestimmtes Format gebracht werden.

Frage: In welchen Formaten liegen die Daten vor?

Manuela Lenk: Das sind die unterschiedlichsten Formate. Wir bekommen Excel-, TXT- oder CSV-Dateien. Vorgegeben ist nur, welche Merkmale zu liefern sind. Wir lesen die Daten ein und bringen sie in eine gemeinsame Form. Wir schlagen den Datenlieferanten natürlich schon vor, einfache Daten, wie zum Beispiel das Merkmal Geschlecht, mit 1 und 2 zu codieren. Die großen Datenlieferanten, von denen wir jedes Jahr Daten erhalten, schicken standardisierte TXT- oder CSV-Dateien, die automatisiert verarbeitet werden. Wir müssen aber alle Dateien betreuen, unabhängig davon, ob fünf Millionen Menschen drin sind oder nur 90.

Frage: Wie werden die Daten zusammengeführt?

Manuela Lenk: Das ist ein ganz wichtiger Punkt, denn hier geht es vor allem auch um den Datenschutz. Bei der Registerzählung erheben wir keine Namen und haben keine Identifikationsmöglichkeit von Einzelpersonen. Das Registerzählungsgesetz schreibt vor, dass wir mit bereichsspezifischen Personenkennzeichen (bPK) arbeiten müssen. Der Datenlieferant hat in seiner Datenbank die Personen mit Identitätsdaten. Das sendet er an die Datenschutzkommission, die mit dem Zentralen Melderegister die Personen identifiziert. Die Stammzahl wird mit einem komplizierten Algorithmus verschlüsselt und als bPK aufgebracht. Wir erhalten die Daten anonymisiert mit verschlüsselter bPK, die nicht rückführbar ist. Diese bPK verwenden wir als Unique Key, mit dem wir die Daten zusammenführen. Für eine solche Datenbank braucht man einen Unique Key.

Frage:: Welche Methoden wenden Sie für die Auswertung der Daten an?

Manuela Lenk: Im ersten Schritt bekommen wir die Rohdaten. Wir lesen sie in ein einheitliches Format ein. Im nächsten Schritt werden die Merkmale standardisiert umgewandelt und in die Datenbank eingebracht. Das Herz ist eine DB2-Datenbank, mit der wir die referentielle Integrität gewährleisten. Die Analysen machen wir mit der Statistik-Software SAS. Ganz vorsichtig geschätzt haben wir für die Probezählung ungefähr 41 Millionen Datenzeilen verarbeitet. Die Größe unseres Speichers würde ich auf 3 bis 4 Terabyte schätzen.

Was uns von anderen Registerzählungsländern unterscheidet, ist das Prinzip der Redundanz. Wir erhalten die Informationen mehrfach aus verschiedenen Quellen. Wir bilden Regeln, wir überlegen uns, aus welchem Register kommt die Information? Wir arbeiten mit Prioritäten. Prinzipiell kann man sagen in Verwaltungsregistern sind die Merkmale gut, die für die Verwaltungshandlung besonders wichtig sind, auf die kann man sich nahezu 100-prozentig verlassen.

Frage: Welche Cluster verwenden Sie für die Auswertung?

Manuela Lenk: Die Hierarchisierung auf Regionalebene ist wichtig. Volkszählungen sind die einzigen Erhebungen, die auf tief regionaler Ebene ausgewertet werden können. Andere Erhebungen wie der Mikrozensus sind bundeslandrepräsentativ.

Wir haben drei wichtige Punkte: die Volkszählung, die Gebäude- und Wohnungszählung und die Arbeitsstättenzählung. Das sind die drei Erhebungsgegenstände der Registerzählung. Das verbindende Element ist das Gebäude- und Wohnungsregister. Dort sind alle Objekte und Wohnungen mit einem numerischen Key enthalten. Das heißt, die Wohnung einer Person mit deren numerischen Key finde ich ebenso im Gebäude- und Wohnungsregister wie die Arbeitsstätte. Das Zentrale Melderegister ist unser Rückgrat für die Bevölkerungszahl, die die wichtigste Zahl unserer Erhebung ist.

Frage: Erwarten Sie sich durch die Registerzählung genauere Daten oder aktuellere Daten als mit einer Fragebogenerhebung?

Manuela Lenk: Der Punkt ist, dass wir imstande sind, nicht nur alle zehn Jahre die Daten zur Verfügung zu stellen, sondern jedes Jahr. Die Erwerbsstatistik zum Beispiel können wir bereits jährlich zur Verfügung stellen. Das ist ganz wichtig, was zum Beispiel Pendlerdaten betrifft. Pendlerdaten hat es immer nur zehnjährig gegeben.

Frage: Das Ziel ist Echtzeitdatenerhebung?

Manuela Lenk: Von Echtzeitdaten sind wir weit entfernt, weil wir die Daten, die wir benötigen, teilweise erst ein Jahr später zur Verfügung gestellt bekommen. Wir haben einen Time Lag von zirka 18 Monaten. Mit dem Qualitätsanspruch, den wir im Moment haben, geht es nicht schneller. Man kann sich vielleicht überlegen, mit geeigneten Schätzverfahren Datenquellen zu substituieren, aber es wird sicher nicht die gleiche Qualität sein wie jetzt.

Frage: Welche Rolle spielt die Qualitätssicherung?

Manuela Lenk: Qualitätssicherung ist ein ganz wichtiges Thema. Für Erhebungen wie den Mikrozensus, der eine Stichprobenerhebungen ist, gibt es gute Qualitätsindikatoren. Für die Registerzählung gibt es keinen herkömmlichen Standard. Wir entwickeln eine eigene Qualitätssicherung für die Durchführung von Statistiken, die auf Verwaltungsdaten basieren. Da sind wir international federführend tätig und schauen, dass wir spezielle und eigene Qualitätsindikatoren erstellen und entwickeln.

Frage: Was sind das für Qualitätsindikatoren?

Manuela Lenk: Da geht es um die Qualitätsbeurteilung der Verwaltungsdaten, um das zu evaluieren, was wir generiert haben. Unsere Daten werden intensiv genutzt – von politischen Stellen, vor allem aber auch von Wissenschaft und Forschung. Ziel ist, dass die Datennutzer einschätzen können, wie hoch die Qualität dessen ist, was wir Ihnen bereitstellen.

Frage: Wo erwarten Sie Schwierigkeiten mit der Registerzählung im nächsten Jahr?

Manuela Lenk: Ich erwarte, auch aufgrund der Probezählung, keine großen Schwierigkeiten. Vor eine Herausforderung stellt uns allerdings beispielsweise der Bereich Familienstatistik. Aus synthetischen Merkmalen, Familien zu generieren, ist nicht trivial. Nehmen Sie zum Beispiel eine Patchwork-Familie: Wenn beide den Familienstand verheiratet haben und in einem Haushalt leben, dann nehme ich an, dies ist ein verheiratetes Paar mit Kind. Aber wenn die nicht miteinander, sondern mit anderen Partnern verheiratet sind, wäre es eine Lebensgemeinschaft. Das erkenne ich aus den Daten nicht. Das sind natürlich keine großen Unschärfen, aber sie sind da. Unser Fokus liegt darauf, geeignete Verfahren zu entwickeln, um die Unschärfen so klein wie möglich zu halten. Das ist eine große Herausforderung.

Frage: Gibt es bessere Prognosemöglichkeiten über gesellschaftliche Entwicklungen durch die Registerzählung?

Manuela Lenk: Die gibt es auf jeden Fall. Nehmen Sie die Erwerbsstatistik, die wir jetzt jährlich durchführen können. Auf tiefer regionaler Ebene ergeben sich Prognosemöglichkeiten und wichtige Informationen für Entscheidungsträger, die man vorher so nicht gesehen hat, da man die Daten nur alle zehn Jahre zur Verfügung hatte.

Share if you care
  • z114 – der Mainframe für den Mittelstand [21]

    TitelbildSchneller, sparsamer und preisgünstiger tritt der IBM zEnterprise 114 an, um hybride IT in mittelständische Unternehmen zu bringen.

  • Smarter Computing [5]

    TitelbildIBM tritt an, um die rasant wachsende Datenmenge und die dazu gehörigen Workloads effizient verarbeiten zu können

  • Smarter Planet auf der Computing-Ebene [2]

    TitelbildIBM geht einen Schritt zurück - um die Datenverarbeitung in ihrer Gesamtheit sehen zu können. Das ist auch gleich der erste Schritt zur Effizienzsteigerung.

  • Das Soziale Netzwerk kommt ins Büro [18]

    TitelbildFür junge Menschen gehören social networks so sehr zum Alltag, dass sie deswegen auch im Beruf eine entscheidende Rolle spielen und die Kommunikation verändern werden.

  • Smart Analytics

    Titelbild"Work smarter, not harder" – mit den Smart Analytics-Anwendungen tritt IBM an, um dieses Ziel auch umsetzen zu können

  • Technologie – smart-sozial

    TitelbildTechnologie ist so wichtig für die Gesellschaft, dass die Menschen kaum darüber nachdenken, dass Technologie allein für sich genommen nicht viel erreicht. Erst die Integration von Technologie in unseren Alltag macht sie unverzichtbar.

  • Watson lernt aus seinen Fehlern [22]

    TitelbildWatson ist ein Supercomputer, der im Frühjahr bei Jeopardy den Profis die Schneid abkauft - obwohl es inzwischen sogar schnellere Rechner gibt

  • 795 – der Tower of Power [17]

    TitelbildIBM launcht, wie nach drei Jahren zu erwarten, nun mit Power 7 die nächste Generation von Power-Prozessoren

  • Das Labor auf einem einzelnen Chip [1]

    TitelbildMit dem „Lab on a chip" beschleunigt und vereinfacht IBM die künftige Blutanalyse und setzt damit einen nächsten Schritt in Richtung Smarter Healthcare

  • "Im Stiegenhaus filmen ist problematisch" [17]

    TitelbildEva Souhrada-Kirchmayer, geschäftsführendes Mitglied der Datenschutzkommission, über Überwachungsverbote, Google und windige Kreditauskunfteien

  • Die Wiener Tafel verteilt nachhaltig um [11]

    TitelbildEine der größten Herausforderungen, mit denen sich Martin Haiderer, Gründer und Obmann der Wiener Tafel, täglich auseinandersetzen muss, betrifft die Logistik

  • "Öffis und Individualverkehr kombinieren" [34]

    TitelbildDieter Gantenbein, IBM-Experte für E-Mobilität, über urbane Verkehrsvisionen und die Möglichkeiten von Elektroautos

  • Das Büro der Zukunft ist überall [50]

    TitelbildDie Arbeitswelt wird in den nächsten Jahren zusehends smarter. Der eigene Schreibtisch als solcher wird verschwinden, ist Thomas Leiner von IBM Österreich überzeugt

  • "Am Land ist man weniger ängstlich" [21]

    TitelbildIn der Stadt gehört die Kriminalität zum Alltag, sagt Alexander Marakovits vom Bundeskriminalamt. Am Land ist man da unsensibler, weil weniger passiert. Aber deshalb sichern in urbanen Regionen die Menschen ihr Eigentum weniger

  • Sicherheitslücken nehmen zu [16]

    TitelbildDie Phishing-Attacken gehen zurück, auch wenn die Finanzwelt immer noch im Focus von Hackern steht, zitiert Angelika Krassnig den aktuellen IBM X-Force Report

  • Wie man am Land so spricht [14]

    TitelbildEinige heimische Firmen dirigieren ihre weltweiten Standorte nicht von einer Metropole aus, sondern aus einer Kleinstadt. Wie sie das machen, fragten wir den Büromöbel-Hersteller Bene und den Leiterplatten-Erzeuger AT&S

  • Bessere Prognosemöglichkeiten durch aktuellere Daten [4]

  • City Branding – Stadt als Marke [16]

    TitelbildImage ist alles. Seit Jahrzehnten gilt das auch für Städte, die sich im Zuge der Globalisierung im internationalen Wettbewerb behaupten müssen

  • Das stete Wachsen der digitalen Daten und Speicher [19]

    TitelbildDie Kapazitäten von Speichermedien und die Menge der entstehenden Daten liefern sich ein rasantes Wettrennen – ohne Gewinner und ohne dass ein Ende absehbar wäre

  • Bildungspolitik, über die Stadtgrenzen hinaus [1]

    TitelbildBildungsgeograph Konrad Höfle über das Stadt-Land-Gefälle von Schulen, die Verhinderung von Brain-Drain und warum regionale Zusammenarbeit sinnvoll ist

  • Eine Stadt macht sich "smarter“ [10]

    TitelbildWiener Neustadt hat ein Zukunftsforum ins Leben gerufen, das ein Bild der urbanen Region in den Jahren 2020 und 2030 zeichnet

  • Stadt - Digital - Smart [2]

    TitelbildLeo Steiner, Generaldirektor IBM Österreich, über das iPad als Zeichen des "Digital Turn" und Beispiele, wie IBM Städte zu "smarter Cities" macht

  • "Eine Stadt braucht Leuchtturmprojekte" [3]

    TitelbildVor allem aber Balance in wichtigen Bereichen wie Gesundheit oder Mobilität macht eine Stadt lebenswert, sagt Norbert Ender von IBM Schweiz

  • Gespräch mit Mark Gilbert

    "Bald ist die Stadt überall" [42]

    TitelbildWarum uns viele Häuschen im Grünen lasches Gemüse bescheren und wie und wieso Städte und ihre Bewohner intelligenter werden müssen

  • "All das ist jetzt schon möglich" [10]

    TitelbildIBM Chief Technologist Helmut Ludwar erklärt, was an Städten smart sein kann und wie urbane Lebensräume in Zukunft aussehen können

4 Postings
d.h. jede Statistik, die ich heute lese

ist 18 Monate alt...

Ah, die Statistik Austria, ...

... gesundes, monatliches Einkommen fürs Nichtstun, da kenne ich persönlich einige Beispiele aus der Vergangenheit. Und sicher auch ein gutes Abstellgleis für ehemalige Funktionäre. Und natürlich müssen die wichtigen Statistikprogramme noch extra zugekauft werden. Aus Steuergeld wohlgemerkt.

"Und natürlich müssen die wichtigen Statistikprogramme noch extra zugekauft werden. Aus Steuergeld wohlgemerkt."

Keine Firma schnitzt sich ihre Statistikprogramme selbst.
Warum das Rad neu erfinden ?
Das selberentwickeln der Statistikprogramme käme 100 mal teurer als der Zukauf.

Es gibt bessere freie open-source Software in diesem Bereich. Es ist Steuergeldverschwendung hier etwas zu kaufen.

Die Kommentare von Usern und Userinnen geben nicht notwendigerweise die Meinung der Redaktion wieder. Die Redaktion behält sich vor, Kommentare, welche straf- oder zivilrechtliche Normen verletzen, den guten Sitten widersprechen oder sonst dem Ansehen des Mediums zuwiderlaufen (siehe ausführliche Forenregeln), zu entfernen. Der/Die Benutzer/in kann diesfalls keine Ansprüche stellen. Weiters behält sich die derStandard.at GmbH vor, Schadenersatzansprüche geltend zu machen und strafrechtlich relevante Tatbestände zur Anzeige zu bringen.