Neue Forschungsansätze auf Basis der synthetischen Population "SynthiePop": Wie virtuelle Individuen durch Datenfusion und Machine Learning greifbar werden

Von Claudia Cramer, Statista
Von Claudia Cramer, StatistaDie Marktforschung steht vor wachsenden Herausforderungen, und klassische Erhebungen stoßen zunehmend an Grenzen: Aufwändige Prozesse, hohe Kosten, schwer erreichbare Zielgruppen und sinkende Datenqualität erschweren valide Ergebnisse. Besonders bei kleinen oder spezifischen Zielgruppen sind Befragungen kaum noch wirtschaftlich umsetzbar. SynthiePop, eine von Statista+ entwickelte synthetische Population, bietet hier eine zukunftsweisende Lösung: Sie ermöglicht tiefgreifende Analysen auf Basis realitätsnaher, virtueller Individuen.
Methode
SynthiePop kombiniert öffentliche Statistikdaten (z. B. Zensus, Arbeitsmarkt, KfZ) mit umfangreichen Befragungsdaten, wie aus Statista Consumer Insights. Durch Datenfusion und Machine Learning entsteht eine Datenbank mit hunderten Merkmalen, die die Gesamtbevölkerung granular abbildet. So ist jede synthetische Person direkt analysierbar. Statistische Verteilungen werden dabei probabilistisch auf die synthetische Population übertragen und mithilfe von Korrekturfaktoren verfeinert. Die Modellierung wird mit zusätzlichen Quellen und Makro-Daten validiert. Befragungsdaten werden mittels trainierter ML-Modelle integriert und anhand unabhängiger Stichproben überprüft.
Ergebnisse und Potenziale
Ein Praxisbeispiel aus einem Projekt für das Eisenbahnbundesamt zeigt das Potenzial: Zur Analyse des Deutschlandtickets wurde eine Online-Befragung (n=3.000) mit SynthiePop kombiniert. Die Ergebnisse ließen sich auf die Gesamtbevölkerung hochrechnen und boten eine bisher unerreichte Tiefe in der Individualanalyse.
SynthiePop eignet sich u. a. für Markt- und Zielgrößenberechnungen, Potenzialanalysen, Segmentierungen oder Konzepttests. Perspektivisch können virtuelle Zielgruppen per generativer KI (GenAI) direkt interaktiv befragt werden – vorausgesetzt, die KI liefert valide, objektive Ergebnisse. Die Synthese aus klassischer Marktforschung und Data Science macht SynthiePop zu einem innovativen Instrument, welches kosteneffiziente und zukunftsweisende Möglichkeiten zur Datenerhebung und Analyse bietet – ein bedeutender Fortschritt für die Branche.
