Das Six-Stage Model of Conversational AI Design wurde am 30. Juni 2021 von Sophie Hundertmark und Prof. Dr. Christian Hildebrand im St. Galler Marketing Review erstmals veröffentlicht. Ein Auszug der wichtigsten Steps befindet sich in diesem Blogbeitrag.
Die beschriebenen 6 Stages sollen Unternehmen bei der erfolgreichen Einführung von Conversational AI Anwendungen, beispielsweise Chat- oder Voicebots unterstützen. Sophie und Christian empfehlen alle 6 Steps Schritt für Schritt abzuarbeiten, um so den Erfolg der neuen AI Anwendung sicher stellen zu können.
Der Begriff Conversational AI wird im folgenden als Überbegriff für jegliche Chat- und Voicebot bzw. Roboter-Anwendungen verwendet,
Stage 1 – WHAT: Define the User Problem
Die erste Stufe beinhaltet die Definition der spezifischen Aufgabe, die von der Conversational AI automatisiert werden soll. Es empfiehlt sich, die gesamte Customer Journey zu analysieren und kritisch zu bewerten, in welchem Stadium Conversational AI-Anwendungen zu den bestehenden Unternehmenszielen beitragen. Die Empfehlung der Experten Sophie und Christian ist hier, zunächst eine Liste spezifischer Aufgaben mit hohem Automatisierungspotenzial zu skizzieren und dann die ausgewählten Anwendungsfälle oder Aufgaben unter dem Gesichtspunkt der Machbarkeit und des Geschäftswerts zu priorisieren. Angenommen, ein Unternehmen hat drei potenzielle Pilotprojekte, bei denen die Optionen zur Lösung des Benutzerproblems zwischen (1) der Automatisierung von Teilen des Kundenserviceprozesses durch einen Chatbot, (2) der Bereitstellung einer automatisierten Entscheidungshilfe durch das Angebot zusätzlicher Produktinformationen auf einer Website durch einen Chatbot oder (3) der aktiven Bereitstellung von Empfehlungen während des Verkaufsprozesses durch einen Chatbot liegen. Während das erste Projekt wohl sehr gut realisierbar ist, ist der erwartete Geschäftswert vergleichsweise gering. Im Gegensatz dazu hat das letzte Projekt einen vergleichsweise hohen Geschäftswert, aber eine geringere Machbarkeit, da die Empfehlungen stark individualisiert und kontextualisiert werden müssen. Schliesslich sollte die klare Formulierung des zu lösenden Problems auch eng mit der Definition verbunden sein, wie das Unternehmen den Fortschritt in Richtung dieses Ziels verfolgen wird (z. B. die Bewertung der Kundenakquisitionskosten vor und nach dem Pilotprojekt oder die Dauer der Kundendienstanrufe, je nachdem, welches Hauptziel die Conversational AI Anwendung verfolgt).
Als weitere Entscheidungshilfe dient hier auch die Value Irritant Matrix von Bill Price. Sie hilft herauszufinden, welche Prozesse und Kunden-Touchpoints am ehesten automatisiert werden sollten. Nämlich genau diese, die für das Unternehmen, zwar einen geringen Wert aufweisen, aber für den Kunden dagegen einen hohen Wert haben.
Zusammenfassend lässt sich sagen, dass die erste Phase einen ausschliesslichen Fokus auf das Problem erfordert, das unbedingt aus der Benutzer bzw. Kundenperspektive angegangen werden soll.
Stage 2 – WHO: Define the Target User
Die zweite Stufe dient der Definition des anvisierten Zielnutzers. Sophie und Christian empfehlen die Verwendung von Methoden, die bereits in früheren Arbeiten zum Customer Journey Mapping verwendet wurden, indem die „archetypische User Persona“ definiert werden (Lemon & Verhoef, 2016). So sollte das Unternehmen den überwiegenden Nutzer des Chatbots bzw. Der Conversational AI Anwendung für das definierte Problem evaluieren (Stufe 1). Die vorgesehene(n) Persona(s) sollte(n) so spezifisch wie möglich sein und sowohl objektive Merkmale wie Demografie (Alter, Geschlecht, Familienstand) als auch subjektive Merkmale wie den erwarteten emotionalen Zustand oder wichtige Werte des Nutzers abdecken. Das Antizipieren des emotionalen Zustands eines Benutzers ist entscheidend, da eine negative Erfahrung eines bereits frustrierten Benutzers zu einer negativen Abwärtsspirale und einer negativen Bewertung des Unternehmens führen kann. Eine aktuelle Studie von Hadi (2019) zeigte beispielsweise, dass Kunden, die sich vor der Interaktion mit einem Kundenservice-Chatbot in einem Zustand der Wut oder Frustration befanden, nach der Interaktion noch frustrierter waren und das Unternehmen im Vergleich zu einer Gruppe von Kontrollkunden negativer bewerteten. Daher wird Unternehmen geraten, den erwarteten Zielnutzer sorgfältig zu definieren und vor allem auch den erwarteten emotionalen Zustand des Nutzers einzubeziehen.
Stage 3 – WHERE: Define the Channel Integration Across Touchpoints
Die dritte Phase dient dazu, zu entscheiden, wie bzw. wo und wann die Conversational AI eingesetzt werden soll. Dies kann von der Integration auf einer bestehenden Website oder innerhalb einer bestehenden Drittanbieterplattform (WhatsApp, WeChat, Facebook, etc.) bis hin zum Einsatz als eigenständige App reichen. In dieser Phase muss entschieden werden, über welchen Kernkanal die Anwendung eingesetzt werden soll und wie der Kanalwechsel über die Touchpoints hinweg gehandhabt werden soll. Beispielsweise könnte sich ein Unternehmen entscheiden, einen Chatbot als Teil seiner Vertriebsautomatisierungsprozesse auf der Website zu implementieren. Die Integration und der Einsatz erfordern also eine Entscheidung darüber, wo auf der Website die Conversational AI zur Verfügung gestellt werden soll und was im Falle eines fehlgeschlagenen Intent-Matchings passieren soll (d. h. wenn die Conversational AI nicht weiss, wie sie eine Anfrage eines Interessenten beantworten oder bearbeiten soll). Bei einem fehlgeschlagenen Intent-Matching sollte der User nahtlos von einem Interaktionskanal zum nächsten wechseln. Dies könnte bedeuten, dass die nahtlose Integration von menschlichen Vertriebsmitarbeitern übernommen wird oder dass die Anfrage direkt als E-Mail an das menschliche Kundenservice-Team weiter geleitet wird. Ein fehlgeschlagenes Intent-Matching und eine ineffektive Kanalintegration sind für Benutzer von Bots aufgrund des geringeren Gefühls der Zielerreichung eine grosse Quelle der Frustration (Leung & Chan, 2020). Ziel der dritten Stufe ist es daher, zu entscheiden, auf welchen Kanal der Fokus gelegt werden soll und mögliche Interaktionen über alle Kanäle und Touchpoints hinweg zu berücksichtigen. Weiter sollten Unternehmen, fehlgeschlagene Intent-Matchings nicht nur vor oder während einer Pilotphase, sondern auch in regelmässigen Zeitabständen nach dem Livegang der Conversational AI-Anwendung sorgfältig auswerten und optimieren. Die meisten Conversational AI-Schnittstellen bieten Identifikatoren, die fehlgeschlagene Interaktionen oder Absichten im Backend explizit kennzeichnen, was sorgfältig und systematisch analysiert werden kann (und sollte).
Stage 4 – HOW: Design the Appearance, Tonality, and Personality of the AI
Die vierte Stufe umfasst alle designbezogenen Entscheidungen und beinhaltet das visuelle Erscheinungsbild und das Konversationsdesign (die strukturellen und semantischen Eigenschaften, wie die Konversation zwischen einem menschlichen Benutzer und der KI geregelt wird).
Das visuelle Design im Kontext von Chatbots umfasst beispielsweise die unternehmens- oder markenkongruente Gestaltung des digitalen Avatars, den Namen des Avatars, die Farbgebung und die Schriftart. Die Auswahl des Avatars und die passende Namensgebung sind kritische Designentscheidungen (Miao et al., 2021), da sie die Marke direkt widerspiegeln. Das Konversationsdesign erfasst die strukturellen und semantischen Eigenschaften der Konversation. Zu den strukturellen Dimensionen gehören z. B. die Häufigkeit oder das Ausmass des Turn-Taking (d. h., ob die Conversational AI aktiv eine Hin- und Her-Kommunikation wie bei der Mensch-zu-Mensch-Kommunikation fördert). Neuere Untersuchungen haben gezeigt, dass ein grösseres Ausmass an Turn-Taking das Vertrauen und eine positivere Bewertung der Marke fördert (Hildebrand & Bergner, 2020). Die semantische Dimension erfasst die Tonalität des Chatbots und kann von einem eher formellen bis hin zu einem informellen Kommunikationston reichen (z. B. durch Verwendung von affektreicher Sprache oder Emojis). Die Kombination aus visuellem und inhaltlichem Design definiert letztendlich die Art der Persönlichkeit, die der Benutzer der KI zuschreibt. So kann z. B. bewusst eine affektreichere Sprache verwendet werden, um eine eher extravertierte „Persönlichkeit“ der KI zu erzeugen. Solche Persönlichkeitszuschreibungen können sogar durch subtilere Hinweise hervorgerufen werden, wie z. B. längere Pausen, um eine grössere Nachdenklichkeit der KI zu signalisieren, oder die Erhöhung der Variabilität der Stimmfrequenz, um Aufregung zu signalisieren (Hilde- brand et al., 2020). Kurz gesagt, menschliche Benutzer neigen dazu, dem Chatbot unterschiedliche Persönlichkeiten zuzuschreiben, und das visuelle und Conversational Design des Systems sind Schlüsselfaktoren bei der Entwicklung der angestrebten Persönlichkeitsprofile des Unternehmens oder der Marke (Nass & Moon, 2000; Nass et al., 1994).
Als Entscheidungshilfen dienen in dieser Phase sicher die Ergebnisse der zweiten Phase, die unter anderen die erwarteten User-Emotionen befassen.
Stage 5 – WITH WHOM: Define the Extended Project Team & Stakeholders
Die fünfte Phase konzentriert sich auf die Definition des erweiterten Projektteams und das aktive Onboarding der internen Stakeholder.
Diese Phase ist essentiell, um die gesamte Organisation und das erweiterte Projektteam (alle internen Stakeholder, die entweder direkt oder indirekt in das Projekt involviert sind, wie z.B. die interne IT-Abteilung) zu gewinnen. Die Tatsache, dass Conversational AI Anwendungen auf relativ neuen technologischen Entwicklungen beruhen, kann zu internen Widerständen führen, die aktiv gemanagt werden müssen. Diese Phase ist entscheidend, um falsche Erwartungen zu vermeiden und gleichzeitig starke interne Promotoren für das Pilotprojekt zu identifizieren. Es ist wichtig, potenzielle interne Widerstände zu antizipieren und auf sie zu reagieren. So ist es beispielsweise empfehlenswert, aktiv zu kommunizieren, wie der Erfolg des Pilotprojekts gemessen wird (z. B. im Rahmen eines Projekts zur Vertriebsautomatisierung; dies kann die Menge des Traffics auf wichtigen Landing Pages, die tatsächlichen Konversionsraten auf diesen Landing Pages oder die Anzahl der besuchten Seiten vor der wichtigen Landing Page beinhalten).
Stage 6 – WITH WHAT: Define the Technology Stack
Die sechste Stufe konzentriert sich auf die Auswahl des am besten geeigneten Technologie-Stacks im Hinblick auf alle vorangegangenen Stufen. Die Entscheidung über den Technologiestack ist aus zwei wesentlichen Gründen in der letzten Stufe des Modells angesiedelt. Erstens sollte der Technologiestack entsprechend dem spezifischen Anwendungsfall ausgewählt werden, unabhängig von den internen Prozessen und der bereits vorhandenen Infrastruktur. Mit dieser Reihenfolge soll vermieden werden, dass die Optionen eingeengt werden und vom zentralen Problem des Endanwenders im Gegensatz zur Technologie abgelenkt werden. Zweitens hilft die Fokussierung auf die Technologie nach den Anforderungen an die Conversational AI dabei, kritisch zu bewerten, ob der anvisierte Anwendungsfall eine komplexe Engine zur Verarbeitung natürlicher Sprache erfordert oder ob ein einfacher regelbasierter Konversationsagent ausreichend ist.
Sophie und Christian geben jedoch zu bedenken, dass in dieser Phase auch die organisatorischen Anforderungen, wie z. B. bereits verwendete Technologien, bestehende Datenschutzbestimmungen und andere Projektressourcen, berücksichtigt werden müssen. Das vorgestellte Modell kann als idealer Archetyp betrachtet werden, und die tatsächliche Umsetzung eines Projekts kann mehrere Iterationen erfordern, die von der Technologie auf frühere Stufen zurückgehen. Da die Zahl der Anbieter von Conversational AI Lösungen weiter wächst (von Amazon, Google, Microsoft und IBM bis hin zu kleineren, spezialisierten Lösungsanbietern), empfehlen Sophie und Christian, die Entwicklung auf der Technologieseite regelmässig zu beobachten. Wie bei jedem Projekt im Bereich der Unternehmensinformatik bieten grosse Unternehmen in der Regel hoch skalierbare, aber eher standardisierte Lösungen an, während kleinere Anbieter oft aktiver beteiligt sind und eine bessere, individuelle Anpassung bieten.
Die folgende Abbildung zeigt das „Six-Stage Model of Conversational AI Design“ entwickelt von Sophie Hundertmark und Prof. Dr. Christian Hildebrand.
Das Paper zum „Six-Stage Model of Conversational AI Design“ wurde erstmals von Sophie Hundertmark und Prof. Dr. Christian Hildebrand im St. Galler Marketing Review veröffentlicht. Das gesamte Journal befindet sich hier.