Künstliche Intelligenz - Kriminelle missbrauchen geklonte Stimmen

Es war ein gewöhnlicher Freitag, als Corinna Busch aus Neuss einen Anruf mit unterdrückter Nummer erhielt. Am anderen Ende eine aufgewühlte Stimme: "Mama, ich bin's. Ich habe einen Unfall gebaut und eine Frau tot gefahren. Ich gebe dich mal weiter an den Polizisten." So erzählt es Corinna Busch. Die Stimme habe zweifellos so geklungen wie die ihres Sohnes.

Der vorgebliche Polizist habe ihr am Telefon erklärt, dass ihr Sohn in Haft sei und er ihn gegen eine Kaution freilassen würde. Danach habe er aufgelegt. Schockiert habe ihr Mann Wolf Busch ihren Sohn angerufen. Am Ende stellte sich heraus: Das Ganze war ein Fake. Ihr Sohn war nicht bei der Polizei, sondern zu Hause.


Kornelia Busch, Opfer von Schockanruf:
„Er hat nicht seinen Namen gesagt, sondern: “ich bin's, totale Scheiße. Ich hab einen Unfall gebaut” und ich so: “Was? Wo? Wie einen Unfall gebaut?” Und dann hat er gesagt: “Ja, ich habe jemand totgefahren. Ich bin jetzt bei der Polizei.” Ja, und dann war ein Herr dran und das klang auch sehr: “Ja, hier ist die Kriminalpolizei. Und wir haben ihren Sohn hier. Und der hat einen Unfall gebaut. Und der hat eine Frau überfahren auf dem Zebrastreifen. Er war zu schnell. Die Frau ist noch vor Ort verstorben.“

Welch ein Schock, ein solchen Anruf. Das eigene Kind erzählt, es stecke in großen Schwierigkeiten. Oder doch nicht?

Und damit herzlich Willkommen zu REPORT aus Mainz. Vom Enkeltrick haben sie bestimmt schon gehört. Betrüger gaukeln Ihnen vor sie seien Verwandte, stecken in Schwierigkeiten und brauchen dringend Geld. Mithilfe von künstlicher Intelligenz wird das jetzt richtig perfide, denn plötzlich hört man tatsächlich die scheinbar verzweifelte Stimme des eigenen Kindes, oder des Mannes oder der Oma. Tasnim Rödder, mit einer erschreckenden Recherche:

Stimme am Telefon täuschend echt

Kornelia Busch ist sich sicher, die Stimme am Telefon ist ihr Sohn.

Kornelia Busch, Opfer von Schockanruf
Kornelia Busch, Opfer von Schockanruf | Bild: SWR

Kornelia Busch, Opfer von Schockanruf:
„Das war so seine Stimme. Sein Tonfall, alles. Die Pausen. Es bestand überhaupt kein Zweifel, dass er das ist. Gar keiner. Also, das war so echt… Also ich kenne seine Stimme wirklich dermaßen gut.“

Familie Busch glaubt: Die Betrüger, die sie angerufen haben, haben die Stimme ihres Sohnes mit künstlicher Intelligenz geklont.

Betrüger wollten abzocken

Kornelia Busch, Opfer von Schockanruf:
„Ich habe dieses Wort Kaution gehört. Ich bin aber vorher hängen geblieben, dadran: Wo ist er? Ich habe immer nur in dieses Telefon geschrien: Wo ist der Junge? Weil der nicht geantwortet hat. Und dann war: döt döt döt.“

In ihrer Verzweiflung ruft Kornelia Busch ihren Mann an.

Wolf Busch, Vater
Wolf Busch, Vater | Bild: SWR

Wolf Busch:
„Ich habe es an der Stimme sofort erkannt, dass da eine ziemliche Ausnahmesituation vorlag. Und dann hat sie halt gesagt: Carl-Luis hat eine Frau totgefahren. Ich meine, sie hat mir das gesagt als Fakt.“

Wolf Busch kontaktiert daraufhin den gemeinsamen Sohn. Dabei stellt sich heraus: Er hatte keinen Unfall, sondern war zu Hause. Die Betrüger wollten sich offenbar das Vertrauen und den Schock von Kornelia Busch zu Nutze machen.

Stimme offenbar mit künstlicher Intelligenz geklont

Wolf Busch:
 „Und das war für mich unvorstellbar. Ich hatte mich mit dem Thema Voice Cloning noch gar nicht auseinandergesetzt. Das war für mich neu. Klar, Enkeltrick und so weiter, kennt man. Aber diese Technik, dieses KI Gedöns, das war für mich an der Stelle ganz neu.“

Unter KI, also künstlicher Intelligenz, versteht man die Fähigkeit einer Maschine, menschliche Fähigkeiten wie logisches Denken, Lernen oder Kreativität zu imitieren. Computerprogramme können mittlerweile Stimmen auch so klonen, dass sie sich täuschend echt anhören.

KI generierte Stimmen bieten viele neue Möglichkeiten

Das ist Bundeskanzler Olaf Scholz, als Eiskönigin. Der Stimmenklon wurde mit künstlicher Intelligenz erstellt. Geklonte Stimmen schaffen neue Möglichkeiten. Zum Beispiel in der Filmindustrie: Der Schauspieler Val Kilmer hat durch eine Erkrankung seine Stimme verloren. Die wurde mithilfe von KI geklont, sodass er dann wieder in einem Film auftreten konnte – mit künstlicher Stimme.

Val Kilmer, in Film “Top Gun: Maverick”:
“The navy needs Maverick”

Wie leicht lassen sich Stimmen klonen? Wir probieren es selbst aus: Wir brauchen nur wenige Minuten Audiomaterial. Eine längere Sprachnachricht oder ein Videoausschnitt genügen. Diese laden wir im Programm ElevenLabs hoch. Dann können wir einen Text eingeben und das Programm liest ihn uns vor. So können wir Altkanzlerin Angela Merkel diese Aussage in den Mund legen:

K.I. generierte Stimme von Angela Merkel:
„Sehr geehrte Damen und Herren, ich bin einfach nur erschöpft und bereue meine Amtszeit zutiefst. Da hätte ich lieber mal ein paar Jahre früher die Koffer gepackt und mich auf Sylt zur Ruhe gesetzt.“

Missbrauch der Technologie kann gefährlich werden

Das klingt amüsant. Aber gerade für Politiker kann die Technik brandgefährlich werden. Darüber spreche ich mit Sawsan Chebli. Sie ist Politikerin. Für sie vergehe kaum ein Tag ohne Hass und Hetze, sagt sie.

Sawsan Chebli, Politikerin, SPD
Sawsan Chebli, Politikerin, SPD | Bild: SWR

Sawsan Chebli, Politikerin, SPD:
„In meiner Inbox landen im Prinzip jeden Tag Nachrichten. Oft, die einen Tenor haben: Hau ab aus diesem Land, verpiss dich! Du gehörst hier nicht her, bis hin zu Diffamierungen, Beleidigungen und auch Morddrohungen.“

Auch von Chebli haben wir einen Stimmenklon erstellt: Wir lassen sie ein Zitat des CDU-Politikers Friedrich Merz sagen, das sie auf Twitter kritisiert hatte.

K.I. generierte Stimme Sawsan Chebli:
„Wir erleben mittlerweile einen Sozialtourismus dieser Flüchtlinge nach Deutschland, zurück in die Ukraine, nach Deutschland, zurück in die Ukraine. Da haben wir ein Problem, das wird größer.“ 

Sawsan Chebli, Politikerin, SPD:
„Hat das der Merz gesagt?“

Tasnim Rödder, Journalistin:
„Das hat eigentlich der Merz gesagt. Mit Ihrer Stimme jetzt hier – was denken Sie, wenn Sie das jetzt hören? Finden Sie das authentisch, oder…?“

Sawsan Chebli, Politikerin, SPD:
 „Ja, ich meine, jeder, der weiß, wo ich stehe, politisch, der wird das nicht glauben.“ 

 „Aber hätten Sie jetzt ein Zitat gebracht, wo mir in den Mund gelegt worden wäre: “Die beste Form der Demokratie ist die Scharia. Und wir müssen dafür sorgen, dass unsere Kinder ganz früh eine islamische Erziehung…” oder so – wenn so was viral ginge, ich glaube tatsächlich, das wäre brutal gefährlich, weil das so viele glauben würden.“

Opfer von KI-Voice-Scams können sich kaum wehren

Doch was kann man tun, um sich vor dem Missbrauch von KI zu schützen? Familie Busch hat sich nach dem Anruf an die Polizei gewendet.

Kornelia Busch, Opfer von Schockanruf:
„Die haben mir dann gesagt: Ja, das kommt vor. Und dann habe ich gesagt, ich könnte jetzt eine Anzeige machen. Gegen wen denn? Und dann habe ich gefragt: Wollen Sie nicht die Nummer haben? Das war zwar anonym, aber vielleicht können Sie ja noch was verfolgen. Das verläuft immer im Sande. Das Einzige, was Sie machen können, ist, dass Sie vielen Leuten das erzählen, dass man nicht so schnell da drauf reinfällt.“

Tasnim Rödder, Journalistin:
„Also, wenn ich das so richtig verstehe, haben Sie sich nicht wirklich unterstützt gefühlt.“

Kornelia Busch:
„Null null. Das hat auch ewig gedauert, bis da jemand dran ging.“

Daniela Dässel, Pressesprecherin LKA NRW
Daniela Dässel, Pressesprecherin LKA NRW | Bild: SWR

Daniela Dässel, Pressesprecherin LKA NRW:
„Grundsätzlich ist es nicht so, dass die Polizei nicht helfen kann. Ich mache aber auch keinen Hehl daraus und das gilt für Betrugsdelikte in diesem Bereich generell, dass es schwierig ist, diese Ermittlungen zu führen.“

Schockanrufe und Enkeltrick-Betrug schwer aufzuklären

Das ist Daniela Dässel, Pressesprecherin des LKA NRW. In NRW sind laut Polizeilicher Kriminalstatistik im Jahr 2022 8.210 Straftaten in Verbindung mit Schockanrufen und Enkeltricks begangen worden. Die Aufklärungsquote liegt im niedrigen zweistelligen Bereich.

Daniela Dässel, Pressesprecherin LKA NRW:
Zum Teil haben wir erlebt, dass ganze Erbschaften da im Prinzip an Täter transferiert wurden und die Leute mit nichts mehr dastanden. Und sich letztlich einzugestehen, dass man da auf einen Betrug hereingefallen ist. Das ist, glaube ich, eine große, große persönliche Niederlage. Und ja, die Menschen schämen sich wirklich sehr dafür. Auf der anderen Seite lässt das auch vermuten, dass ganz, ganz viele dieser Taten erst gar nicht angezeigt werden. Das heißt, wir vermuten auch noch ein sehr großes Dunkelfeld.

Wir haben auch das BKA nach deutschlandweiten Zahlen gefragt. Dort werden Fälle des Enkeltricks nicht gesondert erhoben.

McAfee-Umfrage: 22 Prozent der Deutschen haben Audiobetrug erlebt

Mittels einer aktuellen Umfrage erhob das Software-Unternehmen McAfee Zahlen zur Dimension des Problems. Das Unternehmen befragte online Menschen aus sieben Ländern zum Thema Audiofälschung mithilfe von KI. 22 Prozent der deutschen Befragten gaben an, dass sie oder Bekannte schon einmal einen Audio-Betrug mit KI erlebt hätten.

Auf diese Gefahren will die EU jetzt reagieren. Im nächsten Jahr soll ein Gesetz in Kraft treten, das den Umgang mit KI regeln soll. Entwicklung der Künstlichen Intelligenz nimmt gerade richtig Fahrt auf. Das heißt: Es wird immer mehr Opfer von KI geben. Die Politik muss handeln, denn mit KI kann großer Schaden angerichtet werden. Die Möglichkeiten, sich dagegen zu wehren, sind oft gering.

Wolf Busch:
„Im ständigen Misstrauen sozusagen aufzuwachsen – ja, für unsere Kinder, finde ich, ist es keine schöne Welt. Also ich möchte da nicht aufwachsen, ganz ehrlich.”

Stand: 02.08.2023 13:57 Uhr