SENDETERMIN Sa., 04.05.19 | 16:00 Uhr | Das Erste

Digitale Stimme: Die "geklaute" Stimme

PlayAvatar mit Hollande-Stimme.
Digitale Stimme: Die "geklaute" Stimme | Video verfügbar bis 04.05.2024 | Bild: hr

Unsere Stimme ist Ausdruck unserer Individualität. Sie ist unverwechselbar und einzigartig. So einzigartig, dass sie neuerdings sogar zur Identifikation verwendet wird – zum Beispiel bei der Telekom. Doch ist das wirklich eine gute Idee? Ist unsere Stimme wirklich fälschungssicher?

Auf Stimmenklau

Arianna und Max sind zwei ganz normale junge Leute, mit ganz normalen Stimmen. Die beiden haben wir deshalb ausgewählt, um mit ihnen ein Experiment zu machen: Wir wollen ihre Stimme "klauen" – oder genauer gesagt: sie digital reproduzieren lassen. Und zwar von dem Pariser Unternehmen CandyVoice. Das behauptet von sich, alle Stimmen sehr natürlich reproduzieren zu können. Dazu brauchen die Sprachspezialisten Stimmproben von Max und Arianna. 500 Sätze sind nötig, die alle typischen Laute der deutschen Sprache abbilden. Daraus erstellen die Experten dann jeweils einen sogenannten Stimm-Korpus. Wir nehmen die Sätze in einem Hörfunkstudio auf. Anschließend schicken wir die Aufnahmen nach Paris. Werden wir wirklich täuschend echte digitale Stimmen von Max und Arianna bekommen? Und was können wir damit anstellen?

Stimmexperiment mit verblüffendem Ergebnis

Avatar mit Hollande-Stimme.
Avatar mit Hollande-Stimme. | Bild: hr

Für den Besuch in Paris hat Firmengründer Jean-Luc Crebouw etwas Ungewöhnliches vorbereitet. Er behauptet nämlich, Arianna könne mit der Stimme von Max sprechen. Geht das? Als Arianna in ein Mikrofon spricht und aus dem Lautsprecher Max‘ Stimme erschallt, ist sie überrascht. "Ich hatte mir das schon gedacht, dass das nicht schlecht klingt, aber das ist schon ziemlich gut!" Auch als Max ins Mikro spricht und Ariannas Stimme erklingt, ist er beeindruckt. "Es kam schon ziemlich nah dran, wie ich meine aufgenommene Stimme kenne." Das Ergebnis ist in jedem Fall verblüffend – täuschend echt ist es noch nicht.

Geklonte Trump-Stimme

Stimm-Diagramm einer digitalen Stimme.
Das Programm Lyrebird kann jeder selbst nutzen und die eigene Stimme klonen. | Bild: hr

Die kanadische Softwarefirma Lyrebird hat es vorgemacht. Sie hat die Stimme von Donald Trump anhand von Originalsätzen geklont und kann ihn jetzt sagen lassen, was sie will – und das in jeder beliebigen Tonlage, eine Fake-Voice. Das Programm Lyrebird kann schon heute jeder selbst nutzen und die eigene Stimme klonen. Bislang allerdings nur in Englisch. Wir bitten Arianna, das Programm zu testen. Etwa 20 Sätze muss sie einsprechen. Zehn Minuten später gibt das Computerprogramm jeden beliebigen Satz mit Ariannas Stimme wieder, allerdings noch nicht täuschend echt.

Doch es ist nur eine Frage der Zeit, bis künstliche Intelligenz Stimmen perfekt imitieren wird. Was passiert, wenn man dann nicht mehr sicher sein kann, ob ein Präsident, eine Kanzlerin oder ein Ministerpräsident das, was man hört, wirklich selbst gesagt hat? Werden wir noch wissen, ob uns ein Freund anruft oder jemand mit dessen Computerstimme? Und sind Telefonmitschnitte vor Gericht in Zukunft überhaupt noch beweiskräftig? Bislang können selbst Experten nicht einschätzen, welche Risiken die neue Technik birgt.

Stimme statt Pin

Dennoch wollen immer mehr Firmen, darunter auch deutsche Banken, die Stimme anstelle einer PIN zur Identifizierung einsetzen. Wie sicher das ist, lassen die Firmen unter anderem am Fraunhofer Institut in Darmstadt testen. Projektleiter Florian Kirchbuchner zeigt uns, wie das Stimm-ID-Verfahren funktioniert. Diverse Stimmproben eines Kunden sind bei dem Unternehmen, etwa einer Bank, hinterlegt. Eine Software erstellt daraus ein biometrisches Profil mit über 100 Merkmalen – etwa der Stimmhöhe oder dem Sprechrhythmus. Beim Einloggen per Stimme gleicht das Programm die Stimme des Kunden mit dem hinterlegten Profil ab. Stimmen beide zu 100 Prozent überein, bekommt der Kunde grünes Licht.

Wie sicher ist die "Voice-ID"?

Projektleiter Florian Kirchbuchner spricht in ein Mikrofon
Stimme statt PIN – viele Firmen wollen diesen Weg gehen. | Bild: hr

Aber was ist, wenn man eine Lyrebird-Stimme sprechen ließe? Florian Kirchbuchner ist sich sicher: "Die Lyrebird-Systeme oder ähnliche haben noch nicht die Perfektion erreicht, um wirklich diese Sprachmelodie und alle Sprachfeatures eines Menschen nachzustellen." Aber sie werden immer besser. Google etwa präsentierte jüngst eine intelligente künstliche Stimme, die sich so menschlich anhört, dass sie zum Beispiel per Telefon einen Tisch im Restaurant bestellen kann. "Es ist ein Hase- und Igelspiel, das hier herrscht", sagt Experte Kirchbuchner. "Aber die Softwarehersteller haben momentan noch einen guten Stand. Und die aktuellen Systeme sind auch sicher genug für die einzelne Spracherkennung."

Künstliche Stimmen werden auch in anderen Bereichen eingesetzt – etwa in der Unterhaltungsbranche. Das Pariser Unternehmen Candyvoice entwickelt sie zum Beispiel für Computerspiele. Die Spieler können etwa mit der Stimme von Politiker François Hollande sprechen.

Einsatz im medizinischen Bereich

Aber auch Menschen, die ihre Stimme durch eine Krankheit verlieren werden, können von der Technik profitieren. Dafür müssen sie ihre Stimme vor dem Verlust einsprechen, erklärt CandyVoice-Chef Crebouw: "Unsere Technologie kann die Stimme schon mithilfe von nur 80 Wörtern synthetisieren und die Person danach sagen lassen, was sie will."

Autor: Stefan Venator (hr)

Stand: 19.05.2019 19:04 Uhr

Sendetermin

Sa., 04.05.19 | 16:00 Uhr
Das Erste

Produktion

Norddeutscher Rundfunk
für
DasErste