Fühlen und Rechnen – Wer war gut in Mathe und Deutsch zugleich? Wie das Jobprofil der Qualitativen Sozialforscher mit KI mutiert

Lange Jahre waren die klassischen Jobeinsteiger in der Qualitativen Marktforschung humanistisch geprägt und überwiegend Absolventen der Sozial- und Geisteswissenschaften. Psychologen, Soziologen, Politologen, Ethnologen, Linguisten, Kommunikationswissenschaftlicher, Philologen, aber auch Geographen, Kulturanthropologen… Kein Wunder, denn Qualitative Forschung beschäftigt sich mit kleinen Stichproben, dafür werden die Gesprächspartner in langen und tiefen Interaktionen untersucht. Zählen können mussten wir nicht, da unsere Studien nicht „repräsentativ“ im statistischen Sinne sind. Stattdessen sind wir gut beim stundenlangen Zuhören und kritischen Hinterfragen des Gesagten, sowie beim Interpretieren von Einstellungen, Motiven und Verhalten. Kurzum: Text statt Zahl.

Von der Inflation des Visuellen: von Word zu Powerpoint, Foto und Film

Ich habe 1995 angefangen, in der Branche der Qualitativen Marktforschung zu arbeiten. Ich kann mich an gut hundertseitige Berichte im Wordformat für die großen deutschen oder französischen Konzerne erinnern. Ausgeschrieben, ausformuliert, bis ins feinste Detail redigiert. Es gab Menschen in den Marktforschungs- und Marketingabteilungen (und Werbeagenturen!), die das alles gelesen haben.

Dann kam die Ära der Attention Economy und keiner konnte mehr lesen. Bilder mussten her. Kurze Sätze. Bullet Points. Keine Verben. Die Welt des Multimedia und die visuelle Dominanz unserer Gesellschaft haben neue Skills der Belegschaft erforderlich gemacht: Mit Powerpoint & Co kam der Imperativ der sexy-Folien. Filme und Fotos schmückten das Wort, das fast zum Beiwerk wurde.

Dafür mussten plötzlich Forscher her, die zum bisherigen Repertoire auch noch einen Sinn für Optik hatten. Haben Sie schon einmal typische Einser-Psychologen erlebt? Oder Bücherwürmer? Das „Schöne“ ist zu oberflächlich – die Liebe zum Wort, zum genauen Wortlaut sooooo groß. Also mussten wir lernen, interdisziplinär zu arbeiten: mit Kameraleuten, die aus dem Filmgeschäft kommen, mit Synchronsprechern, mit Schauspielern … Auch mussten wir selbst lernen, ein gutes, verwertbares Foto zu schießen – und nicht nur etwas, das uns bei der Auswertung als Erinnerung dient.

Endlich liest mal wieder einer große Textmengen: die Künstliche Intelligenz!

Aber dann kam sie, die digitale Revolution – auch in der Qualitativen Forschung. Und plötzlich waren Hightech-Companies in der Lage, uns auf der Ebene unstrukturierter Texte zu begegnen. So unsere Zusammenarbeit mit Synomia, in monatelanger R&D und Customization, um die Tausenden von Transkriptionsseiten aus Einzelinterviews verdaulich zu machen.

Plötzlich stehen Sozialwissenschaftler vor einer SaaS (Software-as-a-Service) und lernen, was Natural Language Processing ist. Diese Plattform erlaubt es uns, das Verbatim aus stundenlangen offenen Einzelinterviews in Themen zu organisieren und diese zu gewichten.

Ein Teil von uns jubelt: Es geht um die Sortierung von Verben, Adjektiven, Adverbien, Nominalsätzen. Der Latein-Unterricht kommt wieder hoch und lässt uns in unserer Liebe für Grammatik schwelgen.

Die Maschine interessiert sich auch pointiert für unterschiedliche Formen von Verneinung und das bringt uns neue Erkenntnisse darüber, was Verbraucher nicht nur tun, sondern auch bewusst vermeiden.

Wir realisieren den Einfluss von Interpunktion für das Zerlegen von Verbatim und das plötzlich notwendig gewordene Regelwerk für die Erziehung der Maschine (und der Transkriptionsbüros). Da wir Kommata- und Semikolonritter sind, freuen wir uns über endlose Diskussionen, wie man eine lange Narration (so wie sie in unseren Kognitiven Interviews vorkommt, einer Erhebungsmethode aus der Forensik) überhaupt transkribieren soll.

Die linguistische Kompetenz mit den jeweiligen Sprachkonzepten und idiomatischen Redewendungen macht außerdem erforderlich, dass unsere Mitarbeiter nicht nur über sehr große Menschenkenntnis verfügen, sondern auch kulturaffine Sprachtalente sind.

Das „Codieren“ von Themen: Eine neue Aufgabe

Unsere Arbeitsweise bei der Auswertung war bisher sehr von A3-Papier und mehrfarbigen Finelinern geprägt. Diese haben uns geholfen, unterschiedlichste Muster, Zielgruppen und/oder Themen zu zerlegen, zu visualisieren, und dann sinnvoll zu gruppieren (Dekonstruktion und Rekonstruktion; hermeneutische Auswertungsverfahren).

Mit KI sitzen wir länger am Computer, sichten die bereits verdichteten Stichwörter aus unseren Interviews und überlegen uns, wie wir daraus Themen bilden. Die Maschine hilft uns, große Textmassen schnell zu durchforsten und thematische Schwerpunkte zu erkennen. Das gibt uns ein frühes Erfolgserlebnis, da man sichten kann, wieviel Verbatim-Anteil aus dem gesamten Corpus bereits codiert wurde.

Geht man aber nur nach Häufigkeit des jeweiligen Keywords, verliert man die schwachen Signale („weak signals“). So wie in der unten aufgeführten Tabelle: Bei einer neuartigen Haarcoloration sind plötzlich Themen wie Entspannung (Détente) oder die Nennung der Küche (Cuisine) als Erlebnisort von dem Forscher als brisant zu erkennen. Denn bisher finden die Frauen selten einen großen Entspannungswert bei einer hausgemachten Färbung – und bleiben meistens im Bad eingesperrt. Deshalb sind die subjektiven Einschätzungen und eine gründliche Materialsichtung durch den Forscher so entscheidend.

Diese Grafik zeigt die Anzahl von Verbatim pro Keyword

Abb. 1: Anzahl von Verbatim pro Keyword und die Bedeutung von „weak signals“

Das Wort hat durch KI nicht nur Gewicht, sondern auch Gewichtung

Plötzlich hat das Wort wieder Gewicht. Die Qualitativen Forscher stehen vor einem Paradigmenwechsel: Wo früher lediglich die Anzahl von Testpersonen in einer Studie von Relevanz war (beispielsweise N=15) steht heute V=5.320 (Anzahl von Verbatim aus der besagten Erhebung).

Wie lässt sich die Maßeinheit ‚Verbatim‘, also unsere neue „Währung“, erklären bzw. normieren? So klar wie die Konversionsrate DM zu Euro ist sie leider nicht.

Wir haben sehr lange gebraucht, um unsere Maßeinheit für Verbatim zu definieren. Anfangs wurden die Interviews in einzelne Sätze zerlegt, was aber zu einer Wissenszerklüftung geführt hat. Nach mehreren Experimenten wurden die Sätze wieder gruppiert und so verkettet, dass sie eine ausreichende Länge und damit Aussagekraft erzielen. Bei uns kann ein Verbatim somit ein langer (Ab)Satz sein oder mehrere kleine. Allerdings werden keine Sätze gruppiert, die mit einer Zwischenfrage des Moderators unterbrochen wurden, weil sie inhaltlich möglicherweise nicht mehr zusammengehören.

Diese neue Währung stellt dazu noch eine ethische Frage und bietet eine enorme Chance:

  • Wie vermeiden wir, dass die Vielredner plötzlich das Meinungsmonopol erhalten? Das Gewicht ihrer Verbatims muss also kontrolliert werden. Die Frage stellt sich aber erst recht bei allen Arten von Erhebungen im Netz (Social Media Monitoring, zum Beispiel). Bei unserer Anzahl von Probanden haben wir noch die Möglichkeit, händisch zu prüfen, wer allein mit seiner Meinung vertreten war und in die richtige Perspektive gesetzt werden sollte.
  • Die Maschine lässt uns wieder die Amplitude des Gesagten aufleben: Wer viel über ein Thema spricht, verrät uns dadurch, dass er emotional involviert ist – und das zunächst einmal ganz unabhängig davon, ob mit positiven oder negativen Gefühlen aufgeladen. Denn Indifferenz lässt sich eben schlecht in Worte packen. Die vielfach angepriesene Sentimentanalyse ist für uns zweitrangig. Bei Werbetests ist sie sogar fast irrelevant. Was Syntaxanalyse mit uns Qualitativen Forschern gemein hat, ist, dass sie uns eine weitere Messlatte des Impliziten liefert.
Diese Grafik zeigt eine Gegenüberstellung von zwei qualitativ getesteten Shampoos

Abb. 2: Gegenüberstellung von zwei qualitativ getesteten Shampoos: Allein die Menge an Verbatim zeigt, dass Produkt B (glitzernde orangefarbene Textur mit auffälligem Duft) deutlich mehr Äußerungen und Spontankommentare auslöst als Produkt A (weiße, gewöhnliche Textur mit konsensfähigem Duft) und damit auf ein Produkt mit Profil hinweist.

Mit der Zählung und Gewichtung von Verbatim entsteht aber eine Crux: Wir werden zu neugeborenen Statistikern. Was bedeuten diese plötzlichen Prozentzahlen, die es bei uns bislang nie gab? Worauf beziehen sie sich? Was ist die Grundgesamtheit?

In der unteren Tabelle erfährt man, wie sich Frauen in den Wechseljahren fühlen. Die Prozentzahl liest sich vertikal: 21,4 Prozent der Frauen mit fortgeschrittenen Wechseljahren vs. 17,1 Prozent derjenigen, die sich am Beginn ihrer Wechseljahre befinden, erwähnen in ihrem Diskurs auf unterschiedliche Art und Weise Aspekte, die unter der Überschrift „change process/ i.e. große Veränderung im Leben, Alltag und Körper“ subsumiert werden konnten. Fakten wie „Periode bleibt aus“ sind in beiden Zielgruppen gleich – allerdings zeigen uns die Zahlen, dass Depression und Angstgefühle in dieser Lebensphase zunehmen.

Diese Grafik zeigt die Auswertung der Beschreibung der Wahrnehmung Wechseljahre von betroffenen Frauen

Abb. 3: Beschreibung der Wahrnehmung der Wechseljahre von betroffenen Frauen

Spannend sind diese Erkenntnisse vor allem, wenn man bedenkt, dass ihr Ursprung in einem Blog mit komplett offenen Fragen unter der Führung einer ausgebildeten Moderatorin und Psychologin liegt. Erst danach haben wir die Blog-Teilnehmerinnen in Gruppendiskussionen angetroffen. Die Frauen haben sich ihre seelischen Probleme und körperlichen Beschwerden regelrecht „runtergeschrieben“. Die anschließende Textmenge war enorm und die Lektüre allein hat viele Forschertage in Anspruch genommen. In der vergleichenden Auswertung mit KI, die wir angestellt haben, konnten wir viel schneller die Ergebnisse verdichten und mit der Gewichtung/ Messung vor allem feine Unterschiede zwischen beiden Zielgruppen sichtbar machen.

Fazit: Data Analysts, die sich als Tausendsassa fühlen, werden sehr gefragt sein:

  • Wer empirische Forschung mag,
  • Primär-Erhebung für nicht obsolet hält,
  • drei Sprachen und mehr spricht,
  • Wahrscheinlichkeitstheorie meistert und an Statistik glaubt,
  • psychologische bzw. soziologische Konzepte beherrscht.

… der hat eine große Zukunft!

Natacha Dagneaud, Séissmo

Managing Director bei Séissmo
Studium bei der französischen Sciences-Po Hochschule in Paris; Dipl. Politik- und Sozialwissenschaften FU Berlin; Post-Graduate Etudes & Marketing Sciences-Po Paris; Executive MBA Kellogg-WHU. Gründerin und Managing Director von Séissmo – Markt und Forschung mit dem Schwerpunkt auf internationaler Qualitativer Forschung seit 2001. Pionierforschung bei der Nutzung von non-invasiven Erhebungsmethoden aus der Forensik sowie Einsatz von KI für die Auswertung von unstrukturierten psychologischen Tiefeninterviews. Bietet Grundlagenstudien, Innovationsoptimierung sowie Analysen des Shopper-Verhaltens an.

Weitere Informationen und alle Beiträge


https://www.seissmo.com/
Natacha Dagneaud, Séissmo

Karriere, Trends und Entwicklungen