Ist das Kunst? Persönliche Reflexionen über meine KI-Kunstwerke
Marisa Tschopp
So gelingt die Einbindung von Voice User Interfaces
Die Vielfalt an kreativen Ideen, Problemlösungen, Witzen und Videos zu der jetzigen Zeit ist bemerkenswert. Vom Gewächshaus, das als Minirestaurant dient, über die Bodenbeschriftungen zur Abstandseinhaltung, zum Wirtshaus Drive-In mit frischem Schweinbraten to-go. All diese Massnahmen dienen dem phyiscal (oder social) distancing, also dem physischen Abstand halten. Ziel ist es weniger Berührungspunkte zu bieten, wo sich Viren und Bakterien aufhalten und verbreitet werden, dies vor allem im öffentlichen Raum. Exogene Schocks, wie die Coronapandemie, lässt nicht nur der Kreativität freien Lauf, sondern kommt auch mit einer bemerkenswerten Schnelligkeit daher, vor allem in der Umsetzung. Der Fokus ist klarer, der Druck ist hoch und Lethargie hat keinen Platz. Auch die kritischen Stimmen werden dabei nicht selten vernachlässigt. Dies sind die besten Voraussetzungen für Innovation im Guten, wie im Schlechten. Auch wenn Sprachsteuerung per se keine neue Idee ist, so ist es doch eine Innovation. Voice User Interfaces sind in der Schweiz noch nicht stark verbreitet, obwohl die maschinelle Sprachverarbeitung seit den 60er Jahre erhebliche Fortschritte gemacht hat. Damals präsentierte IBM stolz eine Schuhkarton-grosse Maschine, die 10 Zahlen und einige Wörter mittels Sprache verarbeiten konnte.
Während in den USA fast jeder zweite Amerikaner einen Smart Speaker hat und vor allem Amazons Sprachassistent Alexa sehr stark vertreten ist, so beruhen die VUI-Erfahrungen in der Schweiz eher auf den Digitalen Assistenten des Smart Phones (Amazon ist noch nicht im Schweizer Markt präsent). Apples Siri kann Termine oder Einkaufslisten per Sprachbefehl durchführen, der Google Assistant kann jemanden anrufen oder Musik abspielen, ohne dass man in die App reingehen muss. Wer in der Schweiz beim Anbieter Swisscom eine TV Box hat, kann nun mit dem Wakeword Hey Swisscom die neuesten Sendungen im Fernsehen anschauen oder das Smart Home bedienen, sofern alles entsprechend eingerichtet ist (ohne eine Fernbedienung benutzen zu müssen).
Die Einsparung von ein paar Sekunden ist auf den ersten Blick zwar nicht nobelpreisverdächtig, doch muss man sagen, dass Voice User Interfaces technisch eigentlich schon recht gut aufgestellt. Nur an der Verbreitung hapert es, denn VUIs haben ein Imageproblem und weniger ein Techproblem. Eine gute Technologie reicht noch lange nicht aus, damit sie erfolgreich ist. Dazu gehört auch gute Kommunikation mit allen Facetten des Marketings. Vieles ist theoretisch möglich mit Voice, doch ist #voicefirst
auch sinnvoll? Eine sinnvolle Möglichkeit, wären vor allem Sprachsteuerung in öffentlichen Räumen, wie beispielsweise Türen, die mit Sprache geöffnet werden; Pakete, die mit Sprache signiert werden können; Essensbestellungen im Spitalzimmer oder bei McDonalds.
Das Problem ist aber, dass Sprachsteuerung im öffentlichen Raum eher schwierig ist, da sich viele Menschen schlichtweg unwohl fühlen in der Öffentlichkeit mit einer Maschine zu reden. Könnte hier die Steuerung mittels Gesten eine relevante Ausweichmöglichkeit sein? Google tüftelt diverse Projekte dazu aus, so kann dann z.B. bei der Nutzung eines Smartspeakers die Musik gestoppt werden, indem die Hand hochgehalten wird. Ist das gefahrlos auf Anwendungsfälle im öffentlichen Raum übertragbar? Fakt ist, Berührungspunkte müssen reduziert werden, das erfordert allerdings, die Einsatzmöglichkeiten von VUI systematisch durchzudenken. Dazu gehören mindestens folgende drei Ebenen der Machbarkeit: Technologisch, regulatorisch, ethisch.
Voice User Interface Strategy: Ist es machbar? Ist es erlaubt? Ist es sinnvoll?
Es ist klar, dass nur weil etwas technologisch machbar ist, ein Einsatz von VUI nicht immer sinnvoll ist. Die Unterscheidung von öffentlichem und privatem Raum ist dabei essenziell. Den PIN beim Geldabheben in den Automaten rufen? Es wäre zwar wünschenswert, die physische Eingabe des PINs zu eliminieren, aber Sprachsteuerung ist wohl kaum das richtige Werkzeug hierfür.
Etwas heikler wird es, wenn VUI technologisch und regulatorisch machbar ist, aber ethisch fragwürdig. VUI stellt nicht nur eine Erweiterung der User Journey dar, sondern kann auch Arbeitsplätze oder Services, wie z.B. den Kundendienst überflüssig machen. Klassische Beispiele sind die Callcenter in der Versicherungs- und Bankenbranche. Unter dem Deckmantel Mitarbeiter von monotonen Aufgaben zu erlösen oder 24-Stunden-Service anzubieten, für diejenigen Kunden, die nachts um drei Hypothekarzinsen besprechen möchten, könnten Arbeitsplätze gestrichen und dadurch langfristig Geld eingespart werden. Der ökonomische Nutzen ist aber nicht der einzige Nutzen welcher Relevanz hat. Prof. Dr. R. Hofstetter von der Universität Luzern differenziert noch weiter in funktionalen, prozessbezogenen, emotionalen und sozialen Nutzen. Eine Evaluation nach diesem Muster geht etwas tiefer als die drei Ebenen der Machbarkeit, gibt die Möglichkeit quantitative Benchmarks als eine Entscheidungshilfe anzuwenden und damit eine Entscheidung auf möglichst breiten Kriterien aufzubauen.
Die heutige Gesellschaft, beeinflusst von der Macht der Tech-Giganten wie bspw. Amazon oder Google, neigt dazu, für viele Probleme zuerst oder bevorzugt eine technische Lösung zu suchen (Techsolutionism). Doch oft lindern solche Tech-Patches nur Symptome von tiefsitzenden Problemen, ändern nichts an der Ursache und schaffen schlimmstenfalls sogar noch mehr Probleme. Auch die Corona-Pandemie können wir nicht durch eine App wegzaubern (siehe Contact-Tracing Debatte). Aber eingebettet in ein sinnvolles System (Testen, Distanz, etc.), kann Technologie sehr wohl einen wertvollen Beitrag leisten. Dass da nicht nach dem Motto move fast, break things vorgegangen wird und demokratische Werte als roter Faden, fernab von Überwachungskapitalismus, gelten, sollte eine Selbstverständlichkeit sein.
Zuletzt darf nicht vergessen werden, dass es neben der ganzen Debatte um Funktionalität und Regulation noch etwas anderes gibt. Die Begeisterung an neuen Technologien. Viele technologieaffine Menschen lieben es neue Gadgets auszuprobieren und die Grenzen des Möglichen auf spielerische Art und Weise auszureizen. Oft wird vergessen, dass VUI Spass machen kann und dadurch die User Experience und emotionale Bindung an ein Unternehmen positiv beeinflussen kann. Warum nicht mal etwas ausprobieren? Überlegen, ob es nicht eine spannende Anwendung gibt, die ungefährlich, legal und lustig ist. Das Problem liegt auf der Hand. Zeit ist Geld und die Entwicklung ist noch sehr teuer, vor allem wenn es selbst entwickelt werden soll. Ein Ausweichen auf Alexa, sollte Amazon irgendwann einmal den Schweizer Markt penetrieren, ist zwar beispielsweise günstiger, aber der gute Ruf in punkto Datenmanagement eilt Amazon nicht gerade voraus.
Die Coronapandemie ist Krise und gleichzeitig Treiber von Innovationen. Voice User Interfaces (VUI) könnten einen Aufschwung erleben, als Möglichkeit physische Berührungspunkte zu verringern. Es muss nicht nur nach öffentlichem und privatem Raum unterschieden werden, sondern systematisch nach unterschiedlichem Nutzen (Welchen Nutzen hat ein VUI?) in einem gut definierten Use-case mit bestehender Datenbasis evaluiert werden. Es gibt eine Vielzahl an denkbaren Szenarien und die Vorteile sind durchaus spannend: So können durch ein gutes VUI Bildschirmzeit oder kognitive Lasten reduziert werden. Das heisst, es erlaubt Multitasking, wie z.B. das Navi während dem Fahren mit Sprache zu steuern. Doch auch andere grosse Herausforderungen stehen dem gegenüber, wie Einbindung von Menschen, die nicht gut oder gar nicht sprechen können. Zusammengefasst, wenn Ressourcen vorhanden sind, ist entscheidend, dass der Use-case adäquat ist und, dass von Anfang an eine VUI Strategie mit gleichzeitigem Prototyping interdisziplinär erarbeitet wird.
Dieser Beitrag wurde im Zuge des Weiterbildungskurses Voice User Interface Strategy der Hochschule Luzern geschrieben. Inhalte spiegeln Meinung der Autorin wider und lehnen sich an die Vorträge von Markus Maurer (Farner Lab), Prof. Dr. Reto Hofstetter (University of Lucerne) und Tim Kahle (169Labs) an.
Unsere Spezialisten kontaktieren Sie gern!
Marisa Tschopp
Marisa Tschopp
Marisa Tschopp
Marisa Tschopp
Unsere Spezialisten kontaktieren Sie gern!