Seitenanfang

"Synthetische Daten ermöglichen eine präzisere Kontrolle über Verzerrungen" Interview mit Dr. Katharina Schüller

Dr. Katharina Schüller ist Gründerin und CEO von STAT-UP Statistical Consulting & Data Science Services. Sie gehört zu den führenden Köpfen für Data Science, Künstliche Intelligenz und Statistik. Mit ihrem internationalen Team aus Mathematik und Statistik berät sie internationale Konzerne sowie Bundesministerien und Bundesämter. Zu ihren Kernthemen gehören Datenstrategien, Data Literacy sowie Dathenethik und KI-Ethik. Sie spricht zu den aktuellen Herausforderungen auf führenden internationalen Kongress - so auch beim Kongress der Deutschen Marktforschung 2025 in Berlin.

Werden wir zu synthetischen Befragungsergebnissen in der Zukunft Vertrauen aufbauen können oder dürfen?

Vertrauen in synthetische Befragungsergebnisse wird nur dann entstehen, wenn wir sie nicht überschätzen. Transparenz ist hier das A und O: Wir müssen wissen, welche Daten verwendet wurden, welche Modelle dahinterstecken und welche Annahmen gemacht wurden. Klar, perfekte Modelle gibt es nicht, aber es ist wichtig, dass wir nachvollziehen können, wie sie arbeiten. Nur so können wir mögliche Verzerrungen aufdecken, darüber diskutieren und dann auch vernünftige Entscheidungen treffen. Vertrauen entsteht also nicht einfach so – es braucht sorgfältige Planung, ständige Qualitätskontrolle und das Bewusstsein dafür, welche Limitationen sich ergeben, weil es sich lediglich um statistisch plausible Antworten handelt. Stichwort: „Fit for Purpose“. Für einen schnellen, kostengünstigen Überblick sind synthetische Daten hervorragend geeignet, um Fragestellungen zu explorieren und Hypothesen zu generieren. Nicht aber für schwerwiegende Entscheidungen, die ein tiefes Verständnis von Details erfordern. 

Werden wir bei zunehmendem Einsatz bspw. von synthetischen Panels immer mehr zu einer Art Mitte bei den Ergebnissen tendieren, die menschliche Ausschläge und Konturen verwischen lassen?

Synthetische Panels tendieren dazu, die Durchschnittswerte zu glätten, was bedeutet, dass extreme Meinungen oder Randpositionen seltener auftauchen oder sogar ganz verschwinden können. Das könnte in gesellschaftlichen Diskussionen problematisch werden, weil gerade hier die Vielfalt der Meinungen wichtig ist. Aber es gibt auch einen Vorteil: Synthetische Daten ermöglichen eine präzisere Kontrolle über Verzerrungen, die bei echten Befragungen entstehen können. Letztlich kommt es weniger auf die Methode an, sondern darauf, wie man sie anwendet. Wenn Extrempositionen bewusst berücksichtigt werden und die Modelle auch Abweichungen von typischen Korrelationsstrukturen zulassen, können synthetische Panels ein differenziertes Bild liefern. Werden die „untypischen“ Fälle ausgeblendet, besteht die Gefahr, dass wir ein zu homogenes Meinungsbild bekommen. Aber eine solche Modellierung wird schnell anspruchsvoll – und deutlich teurer.

Und können wir uns auf den Menschen verlassen: Mit welchen Menschen/Befragten müssen wir in Zukunft bei Befragungen rechnen?

Auch in Zukunft werden Menschen eine wichtige Quelle für qualitative Insights bleiben – aber ihre Erwartungen an Befragungen ändern sich. Vor allem digital versierte Zielgruppen achten immer mehr auf Datenschutz, Relevanz und wie viel Zeit sie investieren müssen. Gleichzeitig ist die Bereitschaft zur Teilnahme oft nicht mehr so hoch wie früher. Das bedeutet, wir brauchen neue Ansätze: Umfragen, die persönlicher und interaktiver sind, sowie Technologien, die den Aufwand minimieren und den Nutzen klar machen. Wer Umfragen transparent, vertrauenswürdig und auf Augenhöhe gestaltet, kann weiterhin auf ehrliche Antworten zählen. Eigentlich sollte es selbstverständlich sein, dass Fragebögen keine schwer verständlichen, umständlich zu beantwortenden oder übergriffig formulierten Items enthalten. Gerade wenn wir Menschen zunehmend digital erreichen, dürfen wir nicht vergessen, dass es immer noch Menschen sind. Die respektiert werden wollen dafür, dass sie uns ihre Zeit schenken.

Die Fragen stellte Christian Thunig.

Das Interview erschien erstmalig im Jahrbuch der Marktforschung 2025 (ET: 26.6.2025).