Def Con 26

Stimme nicht einzigartig: Forscher tricksen Siri mit Maschinenlernen aus

Def Con 26: Forscher legen Stimmerkennung mit Maschinenlernen herein. John Seymour und Azeem Aqil präsentierten auf der IT-Sicherheitskonferenz Ergebnisse ihrer Nachforschungen. Sie könnten Apples Siri und auch Microsofts Cloud-Service hereinlegen, indem Sie mit Maschinenlern-Algorithmen synthetische Stimmen erzeugten, die möglichst nah am Original liegen.

Von   Uhr
2 Minuten Lesezeit

Vor kurzem fand in den USA die Def Con 26 statt. Auf dieser IT-Sicherheitskonferenz stellen „Hacker“ und IT-Forensiker gleichermaßen ihre Ergebnisse vor. Ziel dieser Veranstaltung ist, aufzuzeigen, wie leicht manche Systeme zu umgehen sind. Tatsächlich gelang es in diesem Jahr sogar einem Elfjährigen, sich in das elektronische Wahlsystem Floridas zu hacken.

Nutzen Sie Ihre Stimme nicht als Passwort

Darüber hinaus gelang es Forschern, die Stimmerkennung von diversen Dienstleistern auszutricksen. Prominenteste Opfer waren Apples Siri und Microsofts Stimmerkennung in der Azure-Cloud.

Diese Beispiele sollten Ihnen Mahnung genug sein, nicht darauf zu vertrauen, dass ein System Ihre Stimme von allen anderen unterscheiden kann. Denn mit Hilfe von Maschinenlern-Algorithmen gelang es Seymour und Aqil unter Zuhilfenahme von Googles Text-to-Speech-System Tacotron 2 die vorher genannten System und weitere hereinzulegen.

300 Minuten Stimmaufzeichnungen reichen aus

Damit das System Resultate liefert, die möglichst nah an der echten Stimme liegen, benötigt es eigentlich hochwertige Audioaufnahmen, die rund 24 Stunden dauern. Doch Seymour und Aqil reichten am Ende lediglich 300 Minuten.

Sie zeichneten zunächst zehn Minuten der Stimme einer Person auf, und zerschnitten das Audiomaterial in zehn Sekunden lange Schnipsel. Dazu weiteten Sie Ihre Datensätze für das Training des ML-Algorithmus um Daten aus den Open-Source-Datenbanken Blizzard und LJ Speech aus.

Ausgetrickst

Menschliche Hörer konnten im späteren Hörtest keinen Unterschied zwischen der Computerstimme und dem Original wahrnehmen. Doch auch Apples Siri und Microsofts Azure fielen auf die Computerstimme herein.

Mehr zu diesen Themen:

Diskutiere mit!

Hier kannst du den Artikel "Stimme nicht einzigartig: Forscher tricksen Siri mit Maschinenlernen aus" kommentieren. Melde dich einfach mit deinem maclife.de-Account an oder fülle die unten stehenden Felder aus.

Welche sicherheitsrelevanten Dinge kann man denn mit Siri machen - keine?

Apple nutzt Siri ja nicht als Authentifizierungsmechanismus. Aber Sie können mit Siri beispielsweise Türen öffnen, Nachrichten schreiben, etc.

Nein, man kann keine Türen öffnen, da kommt eine Sicherheitsabfrage.

nicht schon ein simples Sprachaufzeichnungsgerät? Früher hiess das Tonbandgerät oder Kassettenrecorder.

Die korrekte Übersetzung von „machine learning“ ins Deutsche ist – glaube ich – maschinelles Lernen, nicht Maschinenlernen.

Die Kommentare für diesen Artikel sind geschlossen.