Wer in den letzten Monaten nicht hinter dem Mond gelebt hat, dem sind die Begriffe „Voice Commerce“ und „Conversational Commerce“ sicher nicht nur einmal begegnet.
Am Amazon Prime Day 2018 waren, wie im Weihnachtsgeschäft auch, die verschiedenen Echo-Geräte echte Bestseller: Mehr als 100 Millionen Smart Speaker-Geräte will Amazon verkauft haben¹. Google bietet, mittlerweile über eine Milliarde Geräte mit Spracherkennung² für seinen Assistant an. Schauen wir uns die Zahlen und mögliche Anwendungen von Voice Commerce mal genauer an.
Was ist Voice Commerce?
Bevor wir uns in das Thema stürzen gilt es, eine gemeinsamen Vorstellung darüber kommen, was Voice Commerce tatsächlich ist. Meines Wissens gibt es keine wissenschaftliche Definition dafür, was also ist der allgemeine Konsens? Die meisten Menschen würden so etwas sagen wie „Transaktionen, die ausschließlich durch einen Sprachservice zustande kommen, entweder in Form eines Smart Speakers oder einer mobilen App.“ Diese Definition stellt allerdings eine eher beschränkte Sichtweise dar, da sie sich ausschließlich auf die Transaktion als solche konzentriert. In der Welt des „klassischen“ E-Commerce entspräche das der Aussage, dass nur dann von E-Commerce die Rede ist, wenn Kunden den Prozess bis zum Bezahlvorgang durchlaufen und dann auch tatsächlich Dinge bestellen.
In Wirklichkeit wissen wir aber alle, was der Begriff Customer Journey bedeutet: Es braucht einige Schritte, bis der Kunde sein Produkt findet. Vielleicht begegnet ihm eine Werbung auf Facebook oder Instagram. Vielleicht sucht er online nach einem speziellen diesem Produkt, schaut sich eben dieses vielleicht in einem Ladengeschäft nochmals genauer an und kauft es letztendlich über einen Online-Marktplatz.
Auch in der Welt der Sprachbefehle brauchen (potentielle) Kunden verschiedene Anlaufstellen, Touchpoints also um ihre Bestellung abzuschließen. Vielleicht fragen sie im ersten Schritt ihren Sprachassistenten nach einem Service oder Produkt („Was brauche ich für einen Kindergeburtstag?“), hören sich das Ergebnis an, suchen dann online nach Ideen und kaufen schließlich bunte Trinkbecher und Süßigkeiten zum Topfschlagen im stationären Laden um die Ecke. Nicht zu vergessen die Kundendienste. Es gibt viele Skills, mit denen sich der Bestellstatus verfolgen lässt.
Mit anderen Worten, eine erweiterte Definition von Voice Commerce – die ich auch für den Rest dieses Artikels anwenden werde – stellt ein Szenario dar, in dem die Nutzung eines Sprachservices Teil des Einkaufsprozesses ist.
Wenn wir uns wirklich an die eingeschränkte Definition halten würden, müsste die Überschrift dieses Artikels außerdem lauten: „Amazon Voice Commerce“. Denn abgesehen von einigen wenigen Ausnahmen ist Amazon aktuell die einzige Plattform, auf der Nutzer ihre Bestellungen per Sprachkommando aufgeben können.
Hardware vs. App vs. Platform
Machen wir eine letzte, wichtige Unterscheidung zwischen der Sprachplattform selbst, der App, die sie nutzt und derHardware, in der sie eingebaut ist:
Plattform: Das ist der Cloud-Service, der die Sprachbefehle interpretiert, die Ergebnisse im Hintergrund kalkuliert und dann eine Antwort unter Nutzung natürlicher Spracherzeugung erstellt.
App: Die App, ein “Skill” in der Amazon-Welt bzw. eine “Action” in der Google-Welt, ist der Vermittler zwischen der Hardware und der Plattform. Sie „lebt“ sozusagen auf einem Gerät, entweder als native App auf einem Smartphone, auf dem Gerät eines Anbieters wie Amazon Echo oder als App auf der Hardware eines Drittanbieters wie Sonos Speaker.
Hardware: Das kann entweder ein komplexes Mehrzweck-Gerät sein wie ein Smartphone oder ein relativ unintelligentes Gerät wie ein Lautsprecher mit wenigen Mikrofonen und WLAN-Funktion.
Bei Amazon macht es keinen Unterschied, ob die Stimme von einem Echo-Gerät oder der Alexa-App auf demSmartphone wahrgenommen wird. Alle Geräte sind mit demselben Konto verbunden. Natürlich werden die Mikrofone die Stimme des Nutzers besser erkennen, je mehr Geräte er besitzt. Außerdem teilt er, indem die Geräte an verschiedenen Orten stehen – im Wohnzimmer, Kinderzimmer, Büro, Auto usw. – etwas sehr wichtiges mit: den Kontext. Normalerweise ändern sich die Gewohnheiten von Menschen je nach Standort, und Amazon kann diese Puzzlestücke dazu verwenden, das Kundenerlebnis zu verbessern und zu personalisieren. Letztendlich finden 95 % aller zwischenmenschlichen Interaktionen nonverbal statt; daher ist es offensichtlich sehr hilfreich für Amazon, Google und all die anderen, sich einige Zusatzinformationen über die verbleibenden 5 % einzuholen.
Mitspieler und Zahlen
Offensichtlich ist der Markt für Sprachanwendungen ein Markt von Anbietern. Dass heißtUnternehmen wie Amazon und Google unternehmen erhebliche Anstrengungen, Kunden von der Nützlichkeit ihrer Produkte zu überzeugen. Dies geschieht durch aufwändige Werbung und extreme Subventionierung ihrer Hardware. Was uns zu den zu Grunde liegenden Systemen bringt: Die erste Frage lautet, wie viele Menschen weltweit tatsächlich einen Sprachassistenten nutzen können. Werfen wir einen Blick auf die Big Player.
Amazon
Amazon ist Spitzenreiter im Bereich Sprachassistenz. Nach einer geschlossenen Betaphase ausschließlich für Prime-Mitglieder hat Amazon sein erstes Echo-Gerät Mitte 2015 auf den US-Markt gebracht. Angeblich baut das Unternehmen diese Plattform seit 2010 auf und wendet seitdem erhebliche Ressourcen dafür auf. Amazon hat bestätigt, dass mittlerweile mehr als 10.000 Mitarbeiter mit der Voice-Technologie arbeiten, was selbst für Amazon-Maßstäbe eine beachtliche Menge ist. Es entstehen am laufenden Band neue Ideen für Geräte – z. B. Echo Show, das über einen integrierten Bildschirm verfügt, um sich Suchergebnisse ansehen zu können, denn ein Bild sagt bekanntlich mehr als tausend Worte. Aber das ist nur ein Beispiel. Amazon experimentiert auch damit, die Alexa-Technologie in alle möglichen Geräte wie Uhren und sogar Mikrowellengeräte zu stecken. Der Online-Händler mischt aber auch in anderen Branchen mit und entwickelt nun die Sprachtechnologie für die BMW-Group, in deren Fahrzeuge die Alexa-Technologie eingebaut wird.
Anders gesagt: Amazon hat den Markt ziemlich gut im Griff, mit einem weltweiten Anteil von 65%. Diese Dominanz zeigt sich ebenfalls in Amazons Bemühungen, ihr Drittanbieter-Ökosystem zu fördern. Das Skill-Verzeichnis des Unternehmens umfasst nun über 50.000 extern entwickelte Skills. Außerdem arbeitet Amazon konstant daran, das Entwickeln von Voice-Skills zu vereinfachen, zum Beispiel durch Einführung der neuen Alexa Hosted Skills. Auch wenn es Skills für alle Lebenssituationen wie Nachrichten, Unterhaltung, Sport und Smart Home gibt, so werden nur etwa 200 Skills in der Kategorie Shopping genutzt. Und von diesen gibt es nur eine von 1-800 Flowers, mit der Kunden etwas bestellen können. Mit allen anderen Skills wie Best Buy und Dell können Kunden nur nach Sonderangeboten suchen oder Tracking-Information anfordern.
Was die Shopping-Funktionalität betrifft, kann nach Alexa-Produkten gefragt werden (es gibt in Bezug auf die Kategorien einige Einschränkungen) und mit einem simplen “Ja” die Bestellung bestätigt werden.
Im Mai 2016 stellte Google seine Plattform Google Assistant als App für Android-Geräte vor, die später auch für iOS-Geräte verfügbar gemacht wurde. Zeitgleich wurde der Smart Speaker Google Home eingeführt, in dem wiederum der Google Assistant steckt. Nach diesem ersten Aufschlag auf dem Markt wurden noch einige andere wie Google Home Max, Google Home Mini oder der Google Home Hub vorgestellt. Letzterer verfügt genau wie Amazons Echo Show über einen Bildschirm. Und wie bei Amazon gibt es nun auch Smart Speaker von Drittanbietern, die mit der Google Assistant-Technologie ausgestattet sind, beispielsweise Bang & Olufsen und JBL.
Anstatt „Skills“ nennt Google seine Anwendungen „Actions“, und führt aktuell über 1 Million davon im Anwendungsverzeichnis. Ich persönlich finde das sehr verwirrend und verwechsle die Actions, die Google selbst erstellt ab und an mit denjenigen von Drittanbietern. Eine andere Quelle erwähnt ungefähr 2.000 Actions. Wenn irgendjemand dazu etwas Licht ins Dunkel bringen kann, bitte kommentieren. Entwickler nutzen Tutorials und Online-Services, um Actions zu erstellen und sie ins Google Assistant-Verzeichnis einzuspeisen.
Was die Shopping-Kategorie betrifft, konnte ich, ähnlich wie bei Amazon, keinen vollwertigen, ausschließlich sprachgesteuerten Bestellmechanismus finden, nur etwas wie einen Geschenkleitfaden für H&M Home, eine Action, um den Bestellstatus von Neiman Marcus aufzurufen, oder eine, die die besten Angebote von Office Depot anzeigt.
Apple
Der iPhone- und iPad-Gigant stellte bereits 2010 im Zuge der Einführung von iOS5 Siri als Sprachservice vor. Mittlerweile ist Siri integraler Bestandteil des Ökosystems von Apple und kann auf iPhones, iPads, iMacs und Apple Watches verwendet werden. Siri werden häufig deutliche Einschränkungen sowie ein Mangel an Qualität attestiert; am meisten wird der Dienst zur Einstellung von Geräten, für Weck- und Erinnerungsfunktionen und die Kalendersuche verwendet. 2018 hat Apple seinem Portfolio den HomePod hinzugefügt, einen Smart Speaker, über den Siri läuft.
Offiziell unterstützt Apple Apps von Drittanbietern für Siri durch das SiriKit, aber offensichtlich findet diese Plattform nicht wirklich Anklang. Ein Grund dafür könnte sein, dass Apples Geschäftsmodell im Gegensatz zu denen von Amazon und Google keine großen Mengen an Profildaten auf seinen Servern einbezieht, sondern stattdessen auf lokale, auf der Hardware der Nutzer gespeicherte Daten zurückgreifen muss, um seine Algorithmen zu trainieren.
Microsoft
Zu guter Letzt mischt auch Microsoft beim Spiel mit der Sprache mit. Der Service Cortana wurde 2014 als Komponente von Windows 10 eingeführt und kann Zeituhren stellen sowie Fragen aus der Bing-Suchmaschine beantworten. Microsoft hat zwar noch keine eigene Hardware auf dem Markt, Cortana l ist aber in die Harman Kardon Invoke Smart Speakers integriert.
Fazit
Natürlich war das nur ein kurzer Überblick zum aktuellen Stand der Voice-Branche. Zu den hier genannten Unternehmen könnte noch so viel mehr gesagt werden, aber auch zu anderen, wie Samsung mit seinem Bixby Service oder Tencent mit Tingting. Wenn es um den Nutzen der Voice-Technologie für den Handel geht, müssen wir den Begriff Handel sehr breit fächern. Nur mit einem Bruchteil der Apps können tatsächlich Produkte bestellt werden und also ein nahtloses, ausschließlich sprachgesteuertes Einkaufserlebnis bieten. Die große Mehrheit der Skills und Actions bezieht sich auf das Entdecken von (neuen) Produkten, Inspiration und Ratschläge.
¹ The Verge: Amazon says 100 Million Alexa Devices have been sold – What's next (Source)
² Google: Here’s how the Google Assistant became more helpful in 2018 (Source)