Das letzte Interview: Konzepte zur Erschaffung Digitaler Doppelgänger

Die Marktforschungsbranche ist fasziniert, aber zugleich auch verängstigt von den neuesten Entwicklungen der Künstlichen Intelligenz und den sich daraus ergebenden neuen Puzzleteilen für die Disziplin der Marktforschung. Unterschiedliche methodische und technologische Ideen konkurrieren derzeit miteinander, doch viele verfolgen ein gemeinsames Ziel: die Erschaffung eines digitalen Daten-Zwillings (oder Digital Doppelganger), der für Marktforschungszwecke und weit darüber hinaus genutzt werden kann. Der Weg führt uns weg von rein synthetischen Daten hin zum "Twinning" durch tiefe, weitreichende Interviews in Kombination mit Vergangenheitsdaten oder Verhaltensdaten.

Die Säulen möglicher digitaler Doppelgänger

Gegenwärtig sind vier unterschiedliche Ansätze zu beobachten, die versuchen, Doppelgänger digital abzubilden:

Synthetic Data Boost: Ein einfacher und schneller Weg, um fehlende Datenpunkte mit KI-Unterstützung zu ergänzen. Die synthetischen Daten fungieren hierbei als Ergänzung zu echten Daten – sei es durch die Generierung neuer Respondenten (Zeilen), neuer Fragen für bestehende Teilnehmer (Spalten) oder das Auffüllen von Lücken (Imputation). Methodisch reicht dies von statistischen Ansätzen wie SMOTE (Synthetic Minority Oversampling Technique) über klassisches Machine Learning bis hin zur generativen KI.
Anbieter wie Evidenza.ai bieten sogar “AI Market Research for Impossible Audiences” an.
Diese sehr spannenden Ansätze werden oft dafür kritisiert, dass sie auf sehr generellen Annahmen unterschiedlicher Large Language Modelle agieren und damit noch viel dunkler erscheinen als eine klassische Black Box.
Passive Data Collection: Die passive Datensammlung ist das Tagesgeschäft der Technologiegiganten. Aber auch in der Marktforschung entstehen immer mehr Ideen, wie Datensätze echter Menschen basierend auf ihrem tatsächlichen Verhalten aus First-Party-Quellen zusammengebaut werden können. Persönliche Fußabdrücke aus Suchhistorien, Plattformen wie TikTok, Instagram, LinkedIn oder die Amazon Such- und Kaufhistorie dienen als Fundament. Ansätze wie "Apply Magic Sauce" der Universität Cambridge oder der App-basierte Ansatz des Bonner Start-ups Datapods zeigen, wie aus digitalen Spuren ein psychologisches Profil abgeleitet werden soll, welches zur Prognose zukünftigen Verhaltens dienen soll. Die Ansätze sind immer so gut, wie ihr Datenfundament und die nachgelagerte Aufgabenstellung. Wer z.B. Zugriff auf die Google Suche und den Amazon Account eines Menschen hat, kann sicherlich gute Prognosen über das Kaufverhalten machen. Da alle Daten hier immer vergangenheitsbasiert sind, ist eine Prognose von Verhalten außerhalb des initialen Kontextes eher schwierig.
Qualitativer Zwilling: Dieser Ansatz nutzt qualitative Methoden der Marktforschung, um Personas zu erstellen. Verschiedene Anbieter erforschen hier gerade sehr aufwendige Prozesse, um Zwillinge auf Basis von tiefenpsychologischen oder morphologischen Interviews zu generieren. Der im Jahr 2025 vom BVM mit dem Innovationspreis bedachte Ansatz von conceptm.ai darf hierbei immer wieder als Leuchtturmprojekt genannt werden. Hierbei werden in intensiven persönlichen Interviews aus einer Mehrzahl von echten Menschen ein Zwilling aggregiert. Der sehr intensive Prozess der Durchführung menschlicher Interviews kann aber inzwischen auch Mithilfe digitaler Chat-Assistenten wie xelper.com unterstützt werden. Hierbei werden die Interviews von einer AI durchgeführt und befragen echte Menschen nach einem Leitfadenkonzept. So können qualitative Interviews über Sprach- oder Textnachrichten automatisiert geführt werden, wobei ein Bot die Moderationsaufgaben übernimmt.
Quantitativer Datenzwilling: Der quantitaive Ansatz versucht Daten zu erheben, aus denen sich eine digitale Kopie der Einstellungen und Werte eines Menschen erstellen lassen. Eine interessante Vorlage dieses Ansatzes ist das Projekt "Twin-2K-500" der Columbia Business School: Dort hat eine außerordentlich umfangreiche Datenerhebung zur Entwicklung und Validierung digitaler Zwillinge stattgefunden.2.000 Personen beantworteten in vier Wellen insgesamt über 500 Fragen aus psychologischen, demografischen und kognitiven Bereichen: Interviewdauer pro Person: 2,42 Stunden. Im Ergebnis entsteht ein quantitativer Datensatz, der dann als Trainingsdatensatz in jeder KI verwendet werden kann.

Alle Ansätze werden bereits verfolgt und die Ergebnisse werden an KI-Modelle geliefert, um Entscheidungen zu treffen. Es scheint neben der Kostenfrage auch eine Glaubensfrage zu sein, welcher Ansatz verfolgt wird. Bei der Bewertung ist natürlich auch die Vorgeschichte der Bewertenden von Relevanz. Wer seine Sozialisation in der quantitativen Marktforschung hatte, wird vielleicht diesem Ansatz mehr Potential zuschreiben. Wer als Tech-Unternehmen ohne Marktforschungshistorie startet, hat vielleicht die höhere Chance, Prozesse völlig neu zu denken. Die eigene Historie für die Bewertung der Zukunft als Grundlage zu nehmen ist für die hyper schnelle Zeit vielleicht keine gute Idee. Die Zukunft wird sicherlich verschiedene Kombinationen dieser Ideen für uns bereithalten. Und jede/r wird diese aus seinem gelernten Blickwinkel anders bewerten wollen.

Abb.1: Der digitale Doppelgänger aus vier potentiellen Datenquellen gespeist

Verwendung der Digitalen Zwillinge in der Marktforschung (and beyond)

Bisher können wir uns noch nicht gut vorstellen, wie ein digitaler Datensatz eine menschliche Antwort ersetzen könnte. Der Weg dahin ist allerdings sehr schnell beschritten. Ein Datensatz (egal aus welcher Kombination von Quellen) kann sofort als Sparringspartner in jedem Large-Language Modell zum Einsatz gelangen. Der Inhaber des Datensatzes kann weitere Interviews durchführen oder Chats oder sogar echte Gespräche mit dem Datenzwilling führen. Digitale Zwillinge funktionieren bereits auf Ebene des klassischen Chats. Menschen lassen sich aber immer wieder davon beeindrucken, wenn man mit dem Zwilling in natürlicher Sprache sprechen kann. Die noch höhere Ausbaustufe ist dann die Verwendung einer Visualisierung in Form eines sprechenden Avatars. Im Extremfall können mehrere dieser Avatare eine Gruppendiskussion miteinander durchführen unter Anleitung eines menschlichen (oder auch künstlichen) Moderators.

Abbildung 2: Vom Datenfundament zur Interviewinteraktion mit Avataren

Muss ein digitaler Zwilling zwangsläufig sprechen können oder eine fotorealistische Präsenz haben? Menschen sind einfache Lebewesen und lassen sich durch solche Extras leichter überzeugen. An dieser Stelle sei darauf hingewiesen, dass die Ergänzung von Sprache oder gar Video in den Prozess zunächst keinen weiteren Beitrag zur Qualität der Antworten leistet, sondern lediglich mehr Rechenzeit der Modelle benötigt und daher aus Gründen der erhöhten Kosten und ökologischen Überlegungen eigentlich keine Option sein sollten. Jedoch ist auch mancher Entscheider von diesen digitalen Taschenspielertricks begeistert. Rein technisch gesehen könnte durch den erhöhten Rechenaufwand, der für Speech2Text, Text2Speech und Videorepräsentation verwendet werden muss, sogar eine niedrigere Qualität des Ergebnisses entstehen. Multimodale LLMs und Multimedia-Dialogtools sind "Nice to have", aber das absolute "Must" und der Schlüssel zu jeder funktionierenden Lösung sind seriöse, tiefgreifende Doppelgänger-Daten.

"Always-on" Consumer Panels ohne Menschen?

Die Möglichkeit der Nutzung von Digitalen Doppelgängern geht über bisherige Anwendungen der Marktforschung hinaus. Der persönliche Bot, der mit den vollständigen Daten einer Person gefüttert ist, kann künftig "das nächste Interview" autonom beantworten. Dies ist keine Zukunftsmusik, sondern eine sehr realistische Annahme. Der Gedanke der autarken Durchführung von klassischen Befragungen darf inzwischen sogar als eher langweilige Idee eingestuft werden, da das Potential über dieses klassische Schema hinaus geht.

Spannender sind individuelle Interaktionen mit interessierenden Doppelgängern. So kann der digitale Datensatz direkt und sehr konkret befragt werden zu Themen, die im initialen Interview gar nicht vorkamen. Eine Validierung dieser Ideen ist einer der nächsten Schritte in der Entwicklung.
In der Summe der Doppelgänger wird daraus die Vision eines Always-on Virtual Consumer Panel für kontinuierliche Marktforschung. In diesem Szenario wird Marktforschung allerdings völlig neu definiert. Auch die Arbeitsteilung wird völlig verändert vonstatten gehen. Die Roboter der Zukunft werden nicht einmal mehr wie typische Roboter agieren, und für die Steuerung dieser gigantischen virtuellen Panels werden möglicherweise gar keine Menschen mehr benötigt.

Abbildung 3: Dystopie des Always-On Virtual Consumer Panels ohne Menschen

Ausblick auf das magische Dreieck von Qualität, Kosten und Zeit in der Marktforschung

Im Studium hat manch eine/r lernen können, dass es oft einen Trade-off zwischen der Qualität, den Kosten und der benötigten Zeit zur Umsetzung einer Aufgabe gibt. Diese Zeiten sind zumindest teilweise vorbei. Mit Künstlicher Intelligenz kann eine ordentliche Qualität zu niedrigen Kosten in minimaler Zeit umgesetzt werden. Die Marktforschung wird sich jetzt auf die Qualitätsposition zurückziehen und propagieren, dass hohe Qualität eben Zeit und Geld kosten kann. In meiner langjährigen Tätigkeit als Marktforscher in Werbeagenturen habe ich gelernt, dass im Kreativprozess nicht alle Beteiligten erhöhten Wert auf Daten- oder Samplingqualität legen, wenn die Kosten hoch sind und die Zeitachse zu lang wird. Der Reality-Check von Kreativideen wurde nicht selten mithilfe willkürlich verfügbarer Menschen umgesetzt. Es geht darum, aus Feedback Dritter eine plausible Erkenntnis für die Veränderung der eigenen kreativen Route zu finden. Am Ende des Tages ist es dem Marketing Entscheider daher sicherlich egal, ob die zutreffende Kritik oder die besondere Idee von einer KI oder einem Menschen stammt. Mithilfe der KI kann der Entscheider alle drei Achsen des magischen Dreiecks gleichzeitig reduzieren.

Abbildung 4: Das Magische Dreieck schrumpft

Wir leben in der verrückten Zeit der Gen AI, wo Kreative inzwischen die Arbeit von Monaten in Stunden umsetzen. Die Marktforschung muss in diesem Turbo-Zeitalter ebenfalls Lösungen anbieten, die in Höchstgeschwindigkeit Entscheidungshilfe bieten. Vor diesem Hintergrund scheint es am wichtigsten, sich ganz schnell von gelernten und geliebten Mechanismen zu verabschieden und umzulernen. Dies wird uns allen schwer fallen. Wenn die Marktforschung dieser Aufgabe aber nicht nachkommt, wird diese Bedarfslücke von Playern, die von außerhalb der Branche stammen, geschlossen werden.

Prof. Dr. Holger Lütters ist Hochschullehrer an der HTW Berlin und seit 30 Jahren in der Marktforschung aktiv. Er hat die zögerliche Haltung der Branche bei den wesentlichen Technologieveränderungen wiederholt miterleben dürfen. Zunächst bei der Onlineforschung, danach bei der zögerlichen Integration von Social Media und dann auch noch bei der verschleppten Integration des Smartphones als Device in der MaFo. Seit 2022 ist er auf den KI-Zug aufgesprungen und disruptiert seine Arbeitsweise täglich neu. Sein Forschungsprojekt “The last interview” widmet sich an der HTW Berlin der Generierung digitaler Doppelgänger.

Beim BVM-Seminar “KI in der Marktforschung” teilt er seine Erkenntnisse regelmäßig gern.

Animationen:
KI-generiert, erstellt von Holger Lütters mit Nano Banana 2, Google Flow, Grok Imagine, Kling 3.0, VEO

Der Autor entschuldigt sich für die überanimierten Darstellungen. Er möchte aber in neuen Umwelten immer die neuen Grenzen ausloten. Die Nachricht, dass das BVM Jahrbuch erstmalig online erscheint hat er als Plädoyer für neue Ausdrucksformen wahrgenommen. Vielleicht ist dies dann der erste Artikel mit animierten Darstellungen aller Zeiten. Wie bei allen Innovationen darf und muss die Sinnfrage aber gestellt werden.

Prof. Dr. Holger Lütters ist Hochschullehrer für Marketing an der Hochschule für Technik und Wirtschaft Berlin. Seine Forschungsschwerpunkte liegen in der Erkundung des sich ändernden Verhaltens von Konsumenten im digitalen Zeitalter. Seine Studien zur Entwicklung der Befragung thematisieren immer wieder neue Formen der digitalen Interaktion im Rahmen der Befragung und nicht reaktiver Messverfahren. Seine Weckrufe zur Digitalisierung und den Auswirkungen der Industrie 4.0 werden von Unternehmen gerne gehört.