Shopping-Tour mit der Stimme

Lauschangriff via Alexa

In der Vergangenheit haben sowohl Mitarbeiter von Amazon als auch von Google einige Kommunikations­ausschnitte der Nutzer ausgewertet. Hintergrund ist, dass es sich bei der Spracherkennung um «Supervised Machine Learning» handelt: Der Mensch «überwacht» und gibt gewisse Regelparameter zur Optimierung der Algorithmen vor. 
Alexa und Google Home sind deshalb so intelligent, weil sie auf Basis riesiger Datensets der Nutzer ihr Modell trainieren können. Bei Amazon sind in der Alexa-App alle Sätze ersichtlich, die sie beantwortet hat. Die Sätze können aber auch gelöscht werden, ähnlich wie beim Browserverlauf. Bei Google Home sind die eigenen Sätze nicht ersichtlich, jedoch über eine Funktion löschbar über «OK Google, lösche meine letzte Unterhaltung». Im Prinzip lassen sich per­sonenbezogene Informationen durch den Nutzer konfigurieren, wie das «Voice Match», das wie beim Finger­abdruck die spezifische Stimme des Nutzers erkennen kann. Der Vorteil hier ist, dass der Assistent dem Nutzer personalisierte Dienste anbieten kann, andere Personen diese Einstellungen aber nicht über die Sprachsteuerung abrufen können. Dies ist auch ein Sicherheitsmechanismus für Beta-Versionen in der Entwicklung. 
Apple hingegen stellt als erster Hersteller die Richt­linien für das «Grading», also die Qualitätsmessung durch Audio-Stichproben und den Datenschutz, um. Audiofiles werden nur über die aktive Zustimmung des Nutzers an Apple geschickt, ansonsten werden für das maschinelle Lernen vom Computer generierte Protokolle analysiert. Apple bestätigt, dass die Audiodaten ihrer Siri-Anfragen per Herbst 2019 nicht mehr gespeichert und dass die Siri-Daten nicht mit der Apple-ID oder der Telefonnummer mit der Identität des Nutzers verknüpft werden. 

V-Commerce in der Schweiz 

Bis zum Jahr 2023 erwarten Schweizer Unternehmen vermehrt die Nutzung von künstlicher Intelligenz sowie von Digitalagenten. Die Mehrheit der Befragten im «Schweizer E-Commerce Report» glaubt an Voice Commerce (V-Commerce). Klar ist, dass «Order by Voice» in den Nachbarländern schon stärker etabliert ist: 60 Prozent der Deutschen nutzen bereits Sprachassistenten, davon 30 Prozent intensiv. 2019 waren es 37 Prozent der Schweizer via Smartphone, davon planten 13 Prozent, demnächst auch einen Smart Speaker zu nutzen.
“Wir reden dreimal schneller, als wir am Smartphone tippen„
Roger Seiler, ZHAW
V-Commerce wird einen ähnlichen Adaptionsverlauf aufzeigen, wie E-Commerce es tat: Die Anbieter und Händler digitaler Produkte sollten ihrem Brand einen einzigartigen persönlichen Assistenten verleihen. Es geht nicht nur darum, auch neu «Conversation» anzubieten, sondern im B2B- und B2C-Bereich starke Kunden­beziehungen und -erlebnisse zu realisieren, die zuvor nicht möglich waren. Einerseits werden Digitalagenten bis 2025 Detailarbeiten beim Checkout-Prozess im Online-Shopping übernehmen. Andererseits werden sie die Suche nach dem passenden Anbieter erleichtern. Da die Kommunikation mithilfe der Sprache natürlicher und intuitiver ist, erfahren Unternehmen eher anhand des Gesprächs die Bedürfnisse und Probleme des Kunden. 
Sprachassistenten sind vor allem dort gut eingesetzt, wo die Hände besetzt sind: am Lenkrad oder beim Kochen. Besonders hilfreich ist die Sprache für die Steuerung von Smart Devices für sehbeeinträchtigte Personen. Heute können viele Bots in der Schweiz allein Auskünfte über Produkte und Dienstleistungen geben. Jedoch ist es nur eine Frage der Zeit, bis Payment-Lösungen auch für die Digitalassistenten hierzulande freigeschaltet werden. Dies könnte der Nutzung dieser Systeme weiteren Schub ver­leihen und dann das V-Commerce-Zeitalter auch in der Schweiz endgültig einläuten.
Zusammenfassung
Umsetzungstipps für Shopping-Assistenten
In der Praxis gibt es bisher kaum zufriedenstellende Shopbots. Anhand empirischer Studien lassen sich folgende Merkmale für erfolgreiche Shopbots nennen: 
  1. Fokus auf eine Hauptfunktion
    Vertikale Assistenten, die domänenspezifische Konversationen führen (zum Beispiel nur Elektronik), sind einfacher mit Bot-Systemen und künstlicher Intelligenz umsetzbar als Social Media Bots, die über sehr viele Domänen sprechen können müssen. 
  2. Erlebnisfördernde Eigenschaften
    Humorvolle, abwechselnde Interaktionen beeinflussen massgeblich die Zufriedenheit mit dem Shopbot. 
  3. Vertrauen als Erfolgsfaktor
    Eine zufriedenstellende User Experience beeinflusst das Vertrauen in den Digitalagenten. Daher sind sichere Zahlungsprozesse und hochwertige Text-to-Speech-Synthesen vertrauensbildend und zentral. Das Vertrauen beeinflusst signifikant die Kaufabsicht im Online-Shopping, belegen Studien. 
  4. Spezifische Warengruppe
    Shopbots eignen sich für wiederkehrend zu kaufende Artikel (zum Beispiel Kolonialwaren, Kosmetikartikel, Putz- und gewisse Haushaltsartikel). 
  5. Logistik und Lieferung
    Schnelle, gebührenfreie Lieferungen als Gesamterlebnis. 
  6. Multimodalität
    Die Spracheingabe ist zentral bei Shopbots, denn sie ist dreimal schneller als das Tippen. Für Produktübersichten eignen sich Visualisierungen optimal, weil sie schneller aufgefasst werden können.
Die Autoren
Nina Habicht und Roger Seiler
Nina Habicht unterstützt Start-ups und Konzerne bei der Entwicklung von Produkten sowie Visionen. Sie ist Gründerin der Plattform Voicetechhub.com und unterstützt als Partnerin des Start-ups Paixon bei der Umsetzung von Sprach­assistenten. Roger Seiler ist stellvertretender Studiengangleiter Wirtschafts­informatik sowie langjähriger Dozent an der ZHAW School of Management and Law.



Kommentare
Es sind keine Kommentare vorhanden.