Zum Inhalt springen
Social Engineering
Aufbau·5 Min·DE · EN

Voice-Cloning & Deepfake-Anrufe

Drei Sekunden Stimm-Sample reichen, um Ihren Chef am Telefon zu imitieren. So bleiben Sie souverän, wenn die vermeintlich vertraute Stimme anruft.

Die Stimme als Beweis - das ist vorbei

KI-basiertes Voice-Cloning ist 2024-2026 vom Forschungs-Spielzeug zum Massenwerkzeug geworden. Tools, die früher Wochen Trainingsdaten brauchten, kopieren heute eine Stimme aus drei Sekunden öffentlich verfügbarem Material - einem LinkedIn-Video, einer Podcast-Folge, einem YouTube-Vortrag. Die Kopie ist gut genug, um am Telefon nicht erkannt zu werden.

01

Bekannte Stimme ≠ verifizierte Person

Die Stimme allein war noch nie Identitätsnachweis - heute weniger denn je. Verifizierung läuft über den Kanal, nicht die Stimme.

02

Rückruf auf bekannte Nummer

Bei jeder ungewöhnlichen Bitte: auflegen, selbst über eine gespeicherte Nummer zurückrufen. Nicht über die Nummer, die anruft.

03

Code-Wort einrichten

Mit Familie und Schlüsselpersonen ein Code-Wort vereinbaren. Bei kritischen Anrufen fragen: 'Sag das Wort.'

Wie ein typischer Deepfake-Anruf abläuft

  1. Recherche: Angreifer findet Ihre Position auf LinkedIn und identifiziert den CEO/Vorgesetzten.
  2. Sample: 3-10 Sekunden Stimm-Aufnahme der Zielperson, z.B. aus einer Podcast-Folge.
  3. Klon: Cloud-Service erzeugt Stimm-Modell in wenigen Minuten, oft unter 30 USD.
  4. Anruf: Mit der geklonten Stimme als CEO ruft der Angreifer Sie an. Hintergrund-Sound (Auto, Flughafen, Meeting) verdeckt kleine Unsauberkeiten.
  5. Bitte: Dringende Überweisung, Passwort-Reset, Daten-Weitergabe. Mit Zeitdruck.
Echter Fall - 2024

Hongkonger Finanzangestellter zahlt 25 Millionen USD aus, nachdem er eine Video-Konferenz mit dem „CFO" und mehreren „Kollegen" hatte. Alle Anwesenden waren Deepfakes - inklusive Stimmen, Gesichter, kleinen Reaktionen. Die Echtheit der Konferenz wurde durch keine zweite Quelle verifiziert.

Ein neuer Kanal war nötig - eine kurze Rückfrage per Chat oder Anruf an die echte Person hätte den Betrug aufgedeckt.

Die Anrufer-Signale, die KI-Klone nicht perfekt schaffen

Auch wenn Stimmen immer besser werden - es gibt Indizien:

  • Atemfehler: KI-Stimmen atmen oft an unnatürlichen Stellen oder gar nicht.
  • Sehr klares Audio: Echte Anrufe haben Hintergrund-Geräusche. Ein zu „studio-klarer" Anruf ist ein Signal.
  • Verzögerte Reaktion auf Unterbrechungen: Klone reagieren oft eine halbe Sekunde verzögert oder wiederholen ihren Punkt mechanisch.
  • Unfähigkeit, zu improvisieren: Fragen Sie nach einem gemeinsamen Erlebnis, einer Insider-Info. Klone scheitern an spontanem Kontext.

Drei Schritte, wenn ein „bekannter" Anruf ungewöhnlich wird

  1. Höflich auflegen: „Ich melde mich gleich zurück." Kein Vorwand nötig.
  2. Verifizieren über zweiten Kanal: Anruf auf bekannte Nummer, Slack/Teams-Nachricht, persönliche Rücksprache.
  3. Erst nach Verifizierung handeln: Auch bei Druck. Echte Vorgesetzte verstehen Vorsicht; Betrüger drängen.
!

Bitte um Diskretion

'Erzähl es niemandem im Team.' Klassische Manipulation - echte Anweisungen vertragen Transparenz.

!

Stimm-Sample, aber nie persönliches Detail

Klone können Stimme imitieren, nicht spontane Erinnerungen.

!

Drängen auf Aktion am Telefon

'Mach es sofort, ich bleibe dran.' Legitimer Kontakt akzeptiert Rückrufe.

!

Anrufer-ID stimmt - Stimme leicht 'off'

Spoofing der Nummer ist trivial. Stimme + Nummer zusammen ist kein Beweis.

Die einfache Regel

Eine Stimme am Telefon ist ein Hinweis auf Identität - aber kein Beweis. Beweise verlangen einen zweiten, unabhängigen Kanal.

Diese Regel galt schon vor KI. Heute ist sie überlebenswichtig.

Bereit, Awareness ernst zu nehmen?

30-Minuten-Demo. Wir zeigen Ihnen eine echte Phishing-Kampagne, ein Quartals-Reporting und das NIS2-Mapping - anhand Ihrer Branche.