Seit dem Start von Alexa, Siri oder Google Assistent und weiteren, weniger bekannten Angeboten hat sich viel getan. Waren zum Anfang die Assistenten nur in der Lage einfache Befehle auszuführen, können diese heute komplexe Fragestellungen abarbeiten. Neben dem klassischen Einsatzgebiet Haushalt haben sich die Assistenten auch in anderen Bereichen breitgemacht, insbesondere E-Autos werden vielfach mit den digitalen Plaudertaschen ausgerüstet.
Wie werden die Sprachbefehle verarbeitet?
Damit digitale Sprachassistenten funktionieren, müssen sie in ständiger Reaktionsbereitschaft sein. Mit anderen Worten: Sie lauschen, und zwar dauerhaft. Nur so können sie erkennen, ob ihr Kennwort zur Aktivierung fällt. Alexa, Siri oder andere Assistenten haben daher ihre Namen bekommen, die sie unverwechselbar machen sollen.
Ertönt das Aktivierungswort, so „hört“ das im Raum befindliche Gerät bereits mit und versucht aus der Spracheingabe einen Befehl abzuleiten. Das Mithören umfasst immer mehr Zeit, als das Aktivierungskennwort selbst benötigt. Nur so kann der Assistent auch einen längeren Befehl von Anfang an mitbekommen. An dieser Stelle versuchen Sprachassistenten auch Fehlaktivierungen zu erkennen und den Aufnahmeprozess abzubrechen. Somit gelangen alle gesprochenen Informationen im Haushalt für eine kurze Zeitspanne auf die Server der Anbieter. Die mitgeschnittenen Gespräche werden dann kurzfristig wieder gelöscht, wenn kein Aktivierungskennwort gesprochen wird. Eine teilweise Ausnahme bildet Apple mit Siri auf dem iPhone. Seit der Betriebssoftware iOS 15 wird ein Teil der Sprachbefehle offline direkt auf dem Gerät verarbeitet.
„Versteht“ der Assistent, was von ihm gewünscht wird, löst er die entsprechende Reaktion aus. Dies kann ein Anruf sein, die Auswahl des nächsten Musikstückes oder ein Steuerbefehl an die smarte Heizung. Dabei bleibt der Assistent nicht stumm, sondern antwortet auf den Sprachbefehl der User mit einer Bestätigung.
Was passiert mit den gesendeten Sprachbefehlen?
Im Lauf der Zeit sammeln sich viele Sprachinhalte auf den Servern des jeweiligen Anbieters an. Diese sind zumeist mit dem eigenen Account verknüpft und können so einzelnen Personen zugeordnet werden. Siri funkt ebenso wie seine Pendants von Google und Amazon nach Hause. Der Unterschied ist jedoch, dass Apple die Sprachinhalte mit einer zufällig generierten Identifikationsnummer versieht und nicht an den jeweiligen Account der Nutzer knüpft. So erhält der Konzern die Sprachinhalte anonymisiert.
Was die Löschung der Inhalte anbetrifft verfahren die Anbieter unterschiedlich. Apple löscht nach sechs Monaten automatisch Sprachinhalte; Amazon und Google bieten an, dass die Inhalte von den Nutzern gelöscht werden können. Bei beiden ist es möglich, eine automatische Löschung einzurichten. Etwas undurchschaubar ist der Umgang mit Sprachinhalten zu Trainingszwecken. Verbessert werden soll dadurch die Qualität der Spracherkennung. Immer wieder wurde bekannt, dass einige Digitalkonzerne Sprachinhalte manuell und von Menschen haben auswerten lassen, ohne dass eine Information und Zustimmung der User eingeholt wurde.
Umgang mit Sprachassistenten
Insbesondere wenn sich Kinder und Jugendliche im gleichen Haushalt aufhalten, sollten Sicherheits- und Präventionsmöglichkeiten genutzt werden. In den Einstellungen der Assistenten können Vorgaben gemacht werden, wie Kinder diese nutzen können. So sollte die Möglichkeit zur Nutzung von Shoppingangeboten erst dann freigeschaltet werden, wenn der Nachwuchs verantwortungsvoll damit umzugehen weiß.
Sprachassistenten können nicht nur alles mithören, was im Haushalt gesprochen wird, sondern sind auch ohne Unterbrechung direkt mit dem Internet verbunden. Umso wichtiger ist es daher, darauf zu achten, dass aktuelle Sicherheits-Updates zeitnah eingespielt werden.
Wird von dem Anbieter des Sprachassistenten anderen Unternehmen ermöglicht mit eigenen Angeboten aufzutreten –sogenannte Skills- dann ist doppelte Vorsicht geboten. Denn diese Zusatzangebote erfüllen nicht unbedingt die Anforderungen, die der Anbieter des Sprachassistenten vorgibt. Daher ist vorab zu prüfen, wie vertrauenswürdig der Drittanbieter wirklich ist. Auf keinen Fall sollten Kreditkarten-Informationen, Passwörter oder andere sensible Daten per Sprachbefehl weitergegeben werden. (eck)
Stand: September 2023