Der E-Commerce Bereich macht sich technologische Innovationen zu Nutze und wendet sie an, um noch näher am Kunden zu sein und ihm den Einkauf so einfach und bequem wie möglich zu machen. Augmented Reality Lösungen machen Produkte und Angebote zu Hause erlebbar, Virtual Reality Technologien ermöglichen virtuelle Shopping Experiences, unabhängig von Zeit und Ort, während Drohnen und Droiden die Lieferung nach dem Kauf beschleunigen. Es gibt allerdings eine Technologie, die nicht nur einzelne Bereiche der Customer Journey verändern, sondern das gesamte Informations- und Einkaufsverhalten von Nutzern revolutionieren könnte: die künstliche Intelligenz.
Künstliche Intelligenz im E-Commerce
Künstliche Intelligenz beschreibt die Entwicklung von Computersystemen, welche Aufgaben bewältigen können, die normalerweise menschliche Intelligenz voraussetzen (Sharma 2016). Dabei muss beachtet werden, dass Künstliche Intelligenz nicht pauschal betrachtet werden darf. Es gibt drei Abstufungen der künstlichen Intelligenz: die Artificial Narrow Intelligence (Weak AI), die Artificial General Intelligence (Strong AI) und die Artificial Superintelligence. Die technologische Entwicklung ist zwar sehr schnell, allerdings befinden sich derzeitige Anwendungen hauptsächlich im Bereich der Artificial Narrow Intelligence. Diese künstliche Intelligenz ist auf einen Bereich spezialisiert, wie beispielsweise Schach oder Spam E-Mails. Sie kann lediglich dort mit der menschlichen Intelligenz mithalten und nicht im Allgemeinen (Sharma 2016; The School of Life 2015). Der technologische Fortschritt der künstlichen Intelligenz wird die Art, wie Menschen mit der digitalen Welt interagieren, dauerhaft verändern. Durch die Anwendung der künstlichen Intelligenz im E-Commerce Bereich entsteht ebenfalls ein neuer Vertriebskanal: der „Conversational Commerce“.
Was ist Conversational Commerce?
Chris Messina beschreibt Conversational Commerce als die Nutzung von Chats, Messaging Diensten oder anderen Anwendungen, die auf natürlicher Sprache basieren, um mit Menschen, Marken oder Services und Bots zu interagieren. Menschen können sich also mit Chatbots von Marken und Unternehmen über Dienste wie den Facebook Messenger, WhatsApp oder Slack unterhalten und während des Gesprächs direkt über diese Kanäle einkaufen oder Services buchen, wie beispielsweise eine Uber Fahrt (Messina 2016). Sprachbasierte Interfaces wie Chatbots oder virtuelle Assistenten heben den dialogorientierten, personalisierten Verkauf im E-Commerce damit auf ein ganz neues Level. Diese intelligenten Systeme kommunizieren mit ihren Nutzern auf einer sehr persönlichen Ebene, was für Unternehmen neue Chancen für den Kundenservice in Echtzeit, die Marke-Kunden-Beziehung und letztendlich die Steigerung das Umsatzes bedeutet (Sokolovska 2016).
Was sind Chatbots?
„Vereinfacht gesagt, ist ein Chatbot eine Technologie mit künstlicher Intelligenz, die Unterhaltungen mit menschlichen Nutzern simulieren soll.“ (Gillner 2016)
Spätestens seit der Facebook F8 Entwicklerkonferenz 2016 sind Chatbots in aller Munde (Gillner 2016). Chatbots sind jedoch keine neue Entwicklung. Der erste Chatbot „Eliza“ wurde 1966 entwickelt und simulierte einen Psychotherapeuten (Serban et al. 2015). Durch die Weiterentwicklung der Künstlichen Intelligenz sind Bots nun auf dem Vormarsch und werden zukünftig die Verbindung zwischen Mensch und Maschine sein. Die Bedienung von Software wird zukünftig keine Maus oder Tastatur mehr erfordern, User-Interfaces werden auf einer Gesprächssituation basieren. Wir müssen also nur mit den Bots sprechen (Temperton 2016).
Der App-Boom ist Geschichte, die Chatbot-Revolution beginnt. Viele Smartphone- Nutzer sind es leid, Apps zu installieren und sich immer wieder an neue Interfaces zu gewöhnen oder persönliche Daten bereitzustellen (ComScore 2016; Temperton 2016). Begünstigt wird die Chatbot-Ära außerdem von einer „mobile first“ Generation, für die Messaging ein fester Bestandteil ihrer digitalen Kommunikation ist (Quoc 2016). Eine der wichtigsten Entwicklungen für die Relevanz von Chatbots ist somit die zunehmende Nutzung von Messaging Apps, auf denen die Chatbots „leben“ und kommunizieren. Laut einem Business Insider Report ziehen mittlerweile Nutzer weltweit Messaging Apps den Sozialen Netzwerken vor, wenn es um Kommunikation geht (BI Intelligence 2016). Durch die Integration von Chatbots in Messaging Apps ist es Unternehmen und Marken daher möglich, mit Nutzern auf einem Kanal zu interagieren, den diese sowieso primär zur digitalen Kommunikation nutzen und der alle persönlichen Daten bereits enthält.
Wie funktionieren Chatbots?
Systeme mit künstlicher Intelligenz haben die Fähigkeit, eigenes Wissen zu erlernen, indem sie Muster aus Rohdaten extrahieren (Goodfellow et al. 2016). Technologien bzw. Teilgebiete der künstlicher Intelligenz sind beispielsweise das Natural Language Processing (NLP) oder Deep Learning (Petereit 2016). NLP wird als maschinelle Verarbeitung natürlicher Sprache bezeichnet. Für Teilbereiche des NLP, vor allem die Spracherkennung, werden Deep Learning Methoden verwendet. Deep Learning bezeichnet den Aufbau und das „Training“ künstlicher, neuronaler Netzwerke, die eine ähnliche Struktur aufweisen, wie das menschliche Gehirn (Schmidhuber 2016; Petereit 2016). Diese Methode basiert auf der statistischen Analyse großer Datenmengen durch künstliche, neuronale Netzwerke, um besonders effizient zu Lernerfolgen zu gelangen. Damit die künstlichen, neuronalen Netzwerke dazulernen können, müssen sie initial trainiert werden und erfordern eine große Menge an Trainingsdaten (Serban et al. 2015). Nach dem initialen Training der Netzwerke besteht ihre Aufgabe darin, stetig dazuzulernen und intelligenter zu werden (Petereit 2016).
Chatbots sind also Dialogsysteme bzw. Software mit künstlicher Intelligenz, die auf natürlicher Sprache basieren und in einen Messaging Dienst, wie WhatsApp oder Facebook Messenger, integriert sind. Sie sind datengetrieben und aufgrund ihrer NLP und Deep Learning Technologien in der Lage, Sprache zu verstehen und zu generieren, um mit Nutzern zu kommunizieren (Serban et al. 2015). Sie können anhand der Breite ihrer Gesprächsthematiken sowie der Entwicklung ihrer Antworten kategorisiert werden (Kojouharov 2016).
Derzeit funktionieren die meisten Chatbots auf der Grundlage von Skripten, also vordefinierten Antworten. Ihre Konversationen basieren auf vordefinierten Schlüssel-wörtern, Fragen, Antworten und Themen (Gillner 2016). Die Gesprächsthematik ist hierbei immer geschlossen. Generative oder intelligenzgesteuerte Chatbots erschaffen Antworten auf Basis des Gesprächsverlaufs. Die Entwicklung solcher generativer Systeme ist aktuell noch am Anfang und vor allem Chatbots mit einer offenen Gesprächsthematik, wie Tay von Microsoft, liegen im Bereich der General AI und sind sehr schwer zu realisieren. Deep Learning Methoden finden in skriptbasierten und generativen Modellen Anwendung. Die Forschung und Entwicklung fokussiert sich jedoch auf letztere Systeme (Kojouharov 2016).
Chatbots können weiterhin durch die Art ihrer Spracherkennung differenziert werden. Es gibt zum einen textbasierte Dialogsysteme, die beispielsweise in Messaging Apps integriert sind, zum anderen existieren verbale oder sprachbasierte Dialogsysteme, wie beispielsweise Siri von Apple, Echo von Amazon oder Google Home. Diese Systeme werden meist als „virtual personal assistant“ bezeichnet (Sokolovska 2016). Textbasierte oder verbale Dialogsysteme können als skriptbasierte, generative oder als Mischung aus beiden Modellen auftreten. Die Funktionsweise von generativen Modellen kann anhand ihrer Systemarchitektur erklärt werden:
Spricht ein User mit einem Chatbot, wird zunächst seine Sprache, in Form von akustischen Wellen, von der „Automatic Speech Recognizer“ Einheit aufgenommen und in Text umgewandelt. Das Herzstück der Chatbot-Architektur ist das Dialogsystem, das aus vier Komponenten besteht. Der „Natural Language Interpreter“ fungiert als Encoder und „übersetzt“ den textlichen Input des Nutzers in Daten, die in den nächsten Schritten verarbeitet werden (Serban et al. 2015; Shang et al. 2015). Die zweite Einheit „Dialogue State Tracker“ summiert den Dialogverlauf bzw. Kontext der Unterhaltung und enthält die Wahrscheinlichkeitsverteilung der möglichen Ziele bzw. Absichten des Nutzers (Plátek et al. 2016). Die „Dialogue Response Selection“ verarbeitet den Input unter Berücksichtigung des Kontexts und der Ziele des Nutzers, um eine Antwort zu generieren. Die zwei Einheiten „Dialogue State Tracker“ und „Dialogue Response Selection“ werden auch als Dialogmanager bezeichnet (Young 2000). Sie können ebenfalls externes Wissen aus bereitgestellten Datenbanken in ihre Prozesse mit einschließen. Im nächsten Schritt „übersetzt“ die Decoder-Einheit „Natural Language Generator“ den Output-Datensatz in Text. Der generierte Output wird ebenfalls von der Kontext-Einheit des Systems registriert. Die Antwort in Textform wird durch den „Text-To-Speech-Synthesizer“ wieder in ein akustisches Signal umgewandelt und dem Nutzer ausgegeben. Handelt es sich bei dem Chatbot nicht um ein verbales System, werden die zwei Einheiten „Automatic Speech Recognizer“ und „Text-To-Speech-Synthesizer“ nicht benötigt (Serban et al. 2015).
Welche technischen Herausforderungen bestehen bei Chatbots?
Generell ist es schwierig, funktionierende generative Modelle zu entwickeln. Sie sind schwer zu trainieren und erfordern eine große Menge an Trainingsdaten. Außerdem weisen die Antworten häufig grammatikalische Fehler auf, da sie auf der trainierten Intelligenz des Systems basieren. Generative Modelle ohne Einschränkung der Gesprächsthematik liegen im Bereich der „General AI“ und sind aktuell noch sehr schwer zu realisieren. Der technische Fortschritt der künstlichen Intelligenz ist hierfür ausschlaggebend. Weiterhin ist die Automatisierung längerer Gespräche sehr schwierig. Bei kurzen Konversationen werden einzelne Antworten zu einzelnen Fragen ausgegeben. Bei langen Gesprächen gibt es mehrere Dialogrunden und der Gesprächskontext ist von großer Bedeutung, was die Schwierigkeit erhöht. Daher ist beispielsweise die volle Automatisierung des Kundenservice aktuell noch nicht möglich. Ebenfalls ist es schwierig, eine Persönlichkeit in ein System zu integrieren, damit ein Chatbot auf Fragen wie „Was ist dein Alter?“ oder „Wie alt bist du?“ immer die gleiche Antwort gibt. Die Evaluation eines generativen Systems ist außerdem ein Problem, da diese menschliches Urteilsvermögen erfordert, was aufgrund der verschiedenen Antwortmöglichkeiten hohe Kosten verursacht (Kojouharov 2016).
Welche Chancen bieten Chatbots für den E-Commerce?
Durch Chatbots werden Messaging Apps zum neuen Kundenservice- und Vertriebskanal. Intelligente Dialogsysteme können menschliche Unterhaltungen führen und Markenerlebnisse zu deutlich günstigeren Kosten schaffen (Sharma 2016). Chatbots personalisieren das Kauferlebnis und können als persönlicher Shoppingberater agieren. Produktempfehlungen und Inspirationen basieren dabei auf persönlichen Daten und Interessen der Nutzer. Der Einkauf eines Produkts oder die Buchung eines Services wird durch den Chatbot im Messaging Dienst beschleunigt und vereinfacht (Gillner 2016). Durch das Anklicken einer Adresse können Nutzer des Facebook Messengers mit Hilfe der Uber-Integration beispielsweise einfach eine Uber-Fahrt buchen, ohne die Uber App selbst zu öffnen (Sokolovska 2016). Die Bezahlung erfolgt ebenfalls schnell und unkompliziert, da die Bezahldaten des Kunden häufig im Nutzerprofil hinterlegt sind, wodurch ein nahtloser Kauf- und Bezahlprozess ermöglicht wird (Gillner 2016).
Aktuell werden Chatbots außerdem zur Erweiterung des Kundenservices genutzt. Der Chatbot reagiert in Echtzeit, ist immer erreichbar und personalisiert. Die Fluggesellschaft KLM nutzt einen Facebook Messenger Chatbot beispielsweise, um Kunden ihre Buchungsbestätigungen, den Flugstatus, Boardingpass und Flugplanänderungen zukommen zu lassen (Kastrenakes 2016). Neben dem Versenden von Benachrichtigungen und Anhängen können Unternehmen durch Chatbots beispielsweise Kundenfeedback generieren, eine Online Wissensdatenbank oder FAQ einrichten. Zukünftig wäre eine Automatisierung des Kundenservice durch Chatbots wünschenswert (Gillner 2016). Dadurch müssten sich die Service Mitarbeiter lediglich um die Optimierung der Chatbot Experience kümmern, was eine enorme Kostenersparnis und vollständige Skalierbarkeit des Kundenservice bedeuten würde. Der Eingriff von menschlichen Mitarbeitern wäre nur in Ausnahmefällen nötig. Vor allem für kleinere Unternehmen mit wenigen Mitarbeitern wäre dies eine große Chance (Newman 2016). Aufgrund der starken Vernetzung und Personalisierung der gesamten Interaktion, wird die Marke-Kunden-Beziehung gestärkt, wodurch eine höhere Loyalität entsteht und individualisierte Marketing- und Vertriebsaktivitäten mit hoher Relevanz ausgespielt werden können (Newman 2016). Chatbots haben ebenfalls einen positiven Effekt auf den Umsatz und Gewinn, da der Einkauf vereinfacht wird und gleichzeitig Kosten eingespart werden (Gillner 2016). Weiterhin führen auf Kundendaten basierende Produktentwicklungen zu relevanteren Lösungen und einer schnelleren Entwicklung (Newman 2016).
Durch Interfaces, die auf Kommunikation basieren, verändert sich weiterhin das Navigationsverhalten der Nutzer. Chatbots sind der Schlüssel für gesprächsbasierte Interfaces, die eine schnellere Suchfunktion bieten und persönlich relevante Ergebnisse liefern. Nutzer müssen also nicht mehr selbst nach einer Antwort suchen, sondern lediglich mit einem Chatbot kommunizieren (Newman 2016; Temperton 2016).
Chatbots: Herausforderungen & Barrieren
Chatbots werden die neue, einfachere Verbindung zwischen Menschen und Maschinen oder Systemen sein. Doch aktuell sind wir noch weit davon entfernt, diese intelligenten Systeme dafür zu nutzen, um nahtlos mit der digitalen Welt in Verbindung zu treten (Newman 2016; Temperton 2016). Wie der intelligenzgesteuerte, generative Chatbot „Tay“ von Microsoft auf Twitter zeigte, sind selbstlernende Systeme noch fehlerbehaftet und leicht zu beeinflussen. Tay imitierte die Sprachmuster eines 19-Jährigen amerikanischen Mädchens und wurde auf Twitter eingesetzt, um von Nutzern zu lernen und mit ihnen zu interagieren. Innerhalb von 15 Stunden wurde Tay radikalisiert und veröffentlichte rassistische und beleidigende Tweets, woraufhin Windows das Experiment beendete (Vincent 2016; Temperton 2016). Zum aktuellen Zeitpunkt bieten Chatbots außerdem keinen ausreichenden Mehrwert. Die Systeme müssen besser verstehen, was Nutzer wollen und eine bessere Experience bieten, als wenn der Nutzer sich selbst auf die Suche nach Produkten oder Informationen begibt. Sie müssen nicht gleich gut wie Menschen sein, sondern besser. Chatbots sollen das Leben noch einfacher machen. Sie müssen Zeit sparen, benutzerfreundlich und einfach zu bedienen sein (Dawson 2016; Temperton 2016). Ein weiterer Punkt ist der Datenschutz bzw. die Privatsphäre. Chatbots in Messaging Apps können auf die personenbezogenen Daten des Nutzerprofils zugreifen (Steiner 2016). Weiterhin sollte die Chatbot Kommunikation verschlüsselt ablaufen. Da Chatbots jedoch auf öffentliche Messaging Dienste angewiesen sind, obliegt es deren Datenschutzrichtlinien, ob die Chatbot Unterhaltung verschlüsselt wird (Martin 2016).
Aktuell sind Chatbots daher noch keine Universallösung, sondern werden eher vereinzelt eingesetzt. Die Entwicklung der künstlichen Intelligenz ist noch am Anfang, wird sich aber schnell verbessern. Chatbots werden als die Zukunft der digitalen Interaktion angesehen, können Menschen jedoch nicht vollständig ersetzen (Dawson 2016; Martin 2016). Die Kombination aus intelligentem Chatbot und menschlicher Unterstützung wäre eine Lösung. Diese hybriden Modelle würden die starke Personalisierung und Kostenersparnis mit menschlicher Interaktion und Intelligenz verbinden. Problematisch ist hier jedoch der nahtlose Gesprächsübergang von künstlicher zu humaner Intelligenz (Wang 2016).
Jessica Ludwig | Hochschule der Medien, Stuttgart
Digital Media Technologies | Prof. Dr. W. Gruel | WS16/17