Was sind eigentlich Deepfakes?

Cybermobbing

Alles Fake?

Immer wieder stößt man auf Social Media auf Deepfakes. Angela Merkel, die sich angeblich über die aktuellen Dönerpreise aufregt oder andere vermeintliche Reden von Politiker*innen – Deepfakes sind mittlerweile überall. Und man kann sie immer schlechter von echten Inhalten unterscheiden. Was Deepfakes überhaupt sind und welche Arten es davon gibt, erfährst du in diesem Artikel.

Was sind Deepfakes?

Deepfakes sind Inhalte, die mithilfe einer KI manipuliert wurden. Dabei kann es sich um Bilder und Videos handeln, aber auch um Stimmen oder Texte.

Fälschung von Gesichtern

Um Deepfakes von Bildern und Videos zu erstellen, werden oftmals Gesichter gefälscht und manipuliert. Dafür gibt es mehrere Vorgehensweisen.

1. Face Swapping

Beim Face Swapping werden die Gesichter von zwei Personen getauscht. Das heißt, das Gesicht von Person A wird auf das Gesicht von Person B gelegt. Dabei bleiben die Gestik und Mimik von Person B allerdings gleich. Jetzt sieht es so aus, als wäre alles, was Person B macht, eigentlich Person A.

Um das zu tun, braucht es eine KI, die zuvor mithilfe von Bildmaterial von Person A genau lernt, wie sich das Gesicht von Person A verhält. Die KI lernt die wichtigsten Mimik- und Bewegungsinformationen und erstellt daraufhin eine Kopie bzw. Maske. Umso mehr Bild-und Videomaterial es von Person A gibt, und um so besser die Qualität des Materials ist, desto besser ist auch das Ergebnis des Deepfakes.

Wie genau das Face Swapping abläuft, könnt ihr euch auch in diesem YouTube-Video ansehen.

2. Face Reenactement

Hier behält Person A das eigene Gesicht. Stattdessen werden die Kopfbewegung, Mimik und auch Lippenbewegung durch eine KI analysiert und verändert. So kann es dazu kommen, das Menschen Aussagen in den Mund gelegt werden, die sie so nie getätigt haben.

Auch hierfür haben wir ein weiterführendes Video für euch.

Fälschung von Stimmen

Was? Angela Merkel beschwert sich über die Preise für Friseurbesuche? Oder diskutiert in einem Video mit Olaf Scholz darüber, dass Dönerpreise zu teuer sind? Richtig gehört. Oder etwa nicht? Auf TikTok gibt es Videos, das klingt es danach. Tatsächlich wurde ihre Stimme aber künstlich nachgemacht.

Beim Erstellen von KI-Stimmen geht es also darum, dass die Stimme einer Person zum Verwechseln genau nachgemacht wird. Das wird teilweise dazu genutzt, um Personen Dinge sagen zu lassen, die sie so nie gesagt haben.

Wie funktioniert das?

Person A soll etwas sagen, dass sie so nie gesagt hat. Dafür braucht man Aufnahmen der Stimme von Person A. Eine KI lernt, wie sie die Höhe der Stimme, den Ton und die Geschwindigkeit imitieren kann. Jetzt kann die Stimme von Person A genutzt werden, um einen Text vorlesen zu lassen (Text-To-Speech (TSS)). Am realistischsten wird allerdings das Ergebnis, wenn eine vorhandene Stimme verändert wird (Voice Conversion).

In unserem nächsten Artikel erfährst du von uns, warum Deep Fakes eigentlich so gefährlich sind und wie du sie erkennen kannst.