Voice User Interface Strategy - Chancen und Risiken von Sprachsteuerung

Voice User Interface Strategy

Chancen und Risiken von Sprachsteuerung

Marisa Tschopp
von Marisa Tschopp
Lesezeit: 10 Minuten

Keypoints

So gelingt die Einbindung von Voice User Interfaces

  • Voice User Interface, auch VUI genannt, bezeichnet Benutzeroberflächen, die mit Sprache gesteuert werden
  • VUIs sind in der Schweiz noch nicht sehr weit verbreitet
  • Aufgrund der Corona-Pandemie (unter anderem), könnten VUIs in der Zukunft relevant sein
  • Eine frühe theoretische Auseinandersetzung mit Chancen, Risiken und strukturellen Voraussetzungen ist wichtig
  • Neben der VUI Strategie wird geraten Nutzenevalution und Prototyping von Anfang an und kontinuierlich durchzuführen

Die Coronapandemie hält die Welt seit Anfang 2020 in Atem und stürzt viele Nationen und Menschen in eine tiefe Krise. Kaum jemand wird in den nächsten Jahren genauso weiter machen können wie bisher, Verhaltensweisen und Prozesse werden zu Recht auf die Probe gestellt. Die Devise lautet: Not macht erfinderisch. Kurse werden besucht, Arbeit und Events werden in die virtuelle Welt verlegt und es wird an den unterschiedlichsten Ideen gearbeitet, die beitragen sollen, die momentane sowie künftige Situation zu verbessern. Im Researchdepartment gehen wir der Frage nach, ob aufgrund der verschärften Hygienebedingungen, Voice User Interfaces (kurz VUI), also Maschinen, die mit Sprache gesteuert werden, einen Aufschwung erleben werden. Welches Potential in VUIs steckt, soll in den kommenden Wochen evaluiert werden. Denn falls VUIs in vier bis fünf Jahren richtig interessant sind, sollte man jetzt anfangen sich damit zu beschäftigen.

Die Vielfalt an kreativen Ideen, Problemlösungen, Witzen und Videos zu der jetzigen Zeit ist bemerkenswert. Vom Gewächshaus, das als Minirestaurant dient, über die Bodenbeschriftungen zur Abstandseinhaltung, zum Wirtshaus Drive-In mit frischem Schweinbraten to-go. All diese Massnahmen dienen dem phyiscal (oder social) distancing, also dem physischen Abstand halten. Ziel ist es weniger Berührungspunkte zu bieten, wo sich Viren und Bakterien aufhalten und verbreitet werden, dies vor allem im öffentlichen Raum. Exogene Schocks, wie die Coronapandemie, lässt nicht nur der Kreativität freien Lauf, sondern kommt auch mit einer bemerkenswerten Schnelligkeit daher, vor allem in der Umsetzung. Der Fokus ist klarer, der Druck ist hoch und Lethargie hat keinen Platz. Auch die kritischen Stimmen werden dabei nicht selten vernachlässigt. Dies sind die besten Voraussetzungen für Innovation im Guten, wie im Schlechten. Auch wenn Sprachsteuerung per se keine neue Idee ist, so ist es doch eine Innovation. Voice User Interfaces sind in der Schweiz noch nicht stark verbreitet, obwohl die maschinelle Sprachverarbeitung seit den 60er Jahre erhebliche Fortschritte gemacht hat. Damals präsentierte IBM stolz eine Schuhkarton-grosse Maschine, die 10 Zahlen und einige Wörter mittels Sprache verarbeiten konnte.

Während in den USA fast jeder zweite Amerikaner einen Smart Speaker hat und vor allem Amazons Sprachassistent Alexa sehr stark vertreten ist, so beruhen die VUI-Erfahrungen in der Schweiz eher auf den Digitalen Assistenten des Smart Phones (Amazon ist noch nicht im Schweizer Markt präsent). Apples Siri kann Termine oder Einkaufslisten per Sprachbefehl durchführen, der Google Assistant kann jemanden anrufen oder Musik abspielen, ohne dass man in die App reingehen muss. Wer in der Schweiz beim Anbieter Swisscom eine TV Box hat, kann nun mit dem Wakeword Hey Swisscom die neuesten Sendungen im Fernsehen anschauen oder das Smart Home bedienen, sofern alles entsprechend eingerichtet ist (ohne eine Fernbedienung benutzen zu müssen).

Voice User Interfaces haben ein Imageproblem

Die Einsparung von ein paar Sekunden ist auf den ersten Blick zwar nicht nobelpreisverdächtig, doch muss man sagen, dass Voice User Interfaces technisch eigentlich schon recht gut aufgestellt. Nur an der Verbreitung hapert es, denn VUIs haben ein Imageproblem und weniger ein Techproblem. Eine gute Technologie reicht noch lange nicht aus, damit sie erfolgreich ist. Dazu gehört auch gute Kommunikation mit allen Facetten des Marketings. Vieles ist theoretisch möglich mit Voice, doch ist #voicefirst auch sinnvoll? Eine sinnvolle Möglichkeit, wären vor allem Sprachsteuerung in öffentlichen Räumen, wie beispielsweise Türen, die mit Sprache geöffnet werden; Pakete, die mit Sprache signiert werden können; Essensbestellungen im Spitalzimmer oder bei McDonalds.

Das Problem ist aber, dass Sprachsteuerung im öffentlichen Raum eher schwierig ist, da sich viele Menschen schlichtweg unwohl fühlen in der Öffentlichkeit mit einer Maschine zu reden. Könnte hier die Steuerung mittels Gesten eine relevante Ausweichmöglichkeit sein? Google tüftelt diverse Projekte dazu aus, so kann dann z.B. bei der Nutzung eines Smartspeakers die Musik gestoppt werden, indem die Hand hochgehalten wird. Ist das gefahrlos auf Anwendungsfälle im öffentlichen Raum übertragbar? Fakt ist, Berührungspunkte müssen reduziert werden, das erfordert allerdings, die Einsatzmöglichkeiten von VUI systematisch durchzudenken. Dazu gehören mindestens folgende drei Ebenen der Machbarkeit: Technologisch, regulatorisch, ethisch.

Voice User Interface Strategy: Ist es machbar? Ist es erlaubt? Ist es sinnvoll?

Es ist klar, dass nur weil etwas technologisch machbar ist, ein Einsatz von VUI nicht immer sinnvoll ist. Die Unterscheidung von öffentlichem und privatem Raum ist dabei essenziell. Den PIN beim Geldabheben in den Automaten rufen? Es wäre zwar wünschenswert, die physische Eingabe des PINs zu eliminieren, aber Sprachsteuerung ist wohl kaum das richtige Werkzeug hierfür.

Voice User Interface Strategien sind ein Balanceakt auf vielen Ebenen

Etwas heikler wird es, wenn VUI technologisch und regulatorisch machbar ist, aber ethisch fragwürdig. VUI stellt nicht nur eine Erweiterung der User Journey dar, sondern kann auch Arbeitsplätze oder Services, wie z.B. den Kundendienst überflüssig machen. Klassische Beispiele sind die Callcenter in der Versicherungs- und Bankenbranche. Unter dem Deckmantel Mitarbeiter von monotonen Aufgaben zu erlösen oder 24-Stunden-Service anzubieten, für diejenigen Kunden, die nachts um drei Hypothekarzinsen besprechen möchten, könnten Arbeitsplätze gestrichen und dadurch langfristig Geld eingespart werden. Der ökonomische Nutzen ist aber nicht der einzige Nutzen welcher Relevanz hat. Prof. Dr. R. Hofstetter von der Universität Luzern differenziert noch weiter in funktionalen, prozessbezogenen, emotionalen und sozialen Nutzen. Eine Evaluation nach diesem Muster geht etwas tiefer als die drei Ebenen der Machbarkeit, gibt die Möglichkeit quantitative Benchmarks als eine Entscheidungshilfe anzuwenden und damit eine Entscheidung auf möglichst breiten Kriterien aufzubauen.

Techsolutionsim: Technologie ist nicht die Lösung für alles

Die heutige Gesellschaft, beeinflusst von der Macht der Tech-Giganten wie bspw. Amazon oder Google, neigt dazu, für viele Probleme zuerst oder bevorzugt eine technische Lösung zu suchen (Techsolutionism). Doch oft lindern solche Tech-Patches nur Symptome von tiefsitzenden Problemen, ändern nichts an der Ursache und schaffen schlimmstenfalls sogar noch mehr Probleme. Auch die Corona-Pandemie können wir nicht durch eine App wegzaubern (siehe Contact-Tracing Debatte). Aber eingebettet in ein sinnvolles System (Testen, Distanz, etc.), kann Technologie sehr wohl einen wertvollen Beitrag leisten. Dass da nicht nach dem Motto move fast, break things vorgegangen wird und demokratische Werte als roter Faden, fernab von Überwachungskapitalismus, gelten, sollte eine Selbstverständlichkeit sein.

VUI kann Spass machen

Zuletzt darf nicht vergessen werden, dass es neben der ganzen Debatte um Funktionalität und Regulation noch etwas anderes gibt. Die Begeisterung an neuen Technologien. Viele technologieaffine Menschen lieben es neue Gadgets auszuprobieren und die Grenzen des Möglichen auf spielerische Art und Weise auszureizen. Oft wird vergessen, dass VUI Spass machen kann und dadurch die User Experience und emotionale Bindung an ein Unternehmen positiv beeinflussen kann. Warum nicht mal etwas ausprobieren? Überlegen, ob es nicht eine spannende Anwendung gibt, die ungefährlich, legal und lustig ist. Das Problem liegt auf der Hand. Zeit ist Geld und die Entwicklung ist noch sehr teuer, vor allem wenn es selbst entwickelt werden soll. Ein Ausweichen auf Alexa, sollte Amazon irgendwann einmal den Schweizer Markt penetrieren, ist zwar beispielsweise günstiger, aber der gute Ruf in punkto Datenmanagement eilt Amazon nicht gerade voraus.

Fazit

Die Coronapandemie ist Krise und gleichzeitig Treiber von Innovationen. Voice User Interfaces (VUI) könnten einen Aufschwung erleben, als Möglichkeit physische Berührungspunkte zu verringern. Es muss nicht nur nach öffentlichem und privatem Raum unterschieden werden, sondern systematisch nach unterschiedlichem Nutzen (Welchen Nutzen hat ein VUI?) in einem gut definierten Use-case mit bestehender Datenbasis evaluiert werden. Es gibt eine Vielzahl an denkbaren Szenarien und die Vorteile sind durchaus spannend: So können durch ein gutes VUI Bildschirmzeit oder kognitive Lasten reduziert werden. Das heisst, es erlaubt Multitasking, wie z.B. das Navi während dem Fahren mit Sprache zu steuern. Doch auch andere grosse Herausforderungen stehen dem gegenüber, wie Einbindung von Menschen, die nicht gut oder gar nicht sprechen können. Zusammengefasst, wenn Ressourcen vorhanden sind, ist entscheidend, dass der Use-case adäquat ist und, dass von Anfang an eine VUI Strategie mit gleichzeitigem Prototyping interdisziplinär erarbeitet wird.

Anmerkungen zur Reihe Voice User Interface Strategy

Dieser Beitrag wurde im Zuge des Weiterbildungskurses Voice User Interface Strategy der Hochschule Luzern geschrieben. Inhalte spiegeln Meinung der Autorin wider und lehnen sich an die Vorträge von Markus Maurer (Farner Lab), Prof. Dr. Reto Hofstetter (University of Lucerne) und Tim Kahle (169Labs) an.

Über die Autorin

Marisa Tschopp

Marisa Tschopp (Dr. rer. nat., Universität Tübingen) ist aktiv in der Forschung zu Künstlicher Intelligenz aus menschlicher Perspektive, wobei sie sich auf psychologische und ethische Aspekte fokussiert. Sie hat ihre Expertise unter anderem auf TEDx-Bühnen geteilt und repräsentiert die Schweiz in Genderfragen innerhalb der Women in AI Initiative. (ORCID 0000-0001-5221-5327)

Links

Sie wollen eine KI evaluieren oder entwickeln?

Unsere Spezialisten kontaktieren Sie gern!

×
Ist das Kunst? Persönliche Reflexionen über meine KI-Kunstwerke

Ist das Kunst? Persönliche Reflexionen über meine KI-Kunstwerke

Marisa Tschopp

Conversational Commerce

Conversational Commerce

Marisa Tschopp

ChatGPT & Co.

ChatGPT & Co.

Marisa Tschopp

TEDxBoston Countdown to AGI

TEDxBoston Countdown to AGI

Marisa Tschopp

Sie wollen mehr?

Weitere Artikel im Archiv

Sie brauchen Unterstützung bei einem solchen Projekt?

Unsere Spezialisten kontaktieren Sie gern!

Sie wollen mehr?

Weitere Artikel im Archiv