Einschätzung auf correctiv.org über potenzielles Audio-Deepfake
Mittwoch, 13. März
Ein Audio-Deepfake von Nawalyns Mutter scheint im Netz die Runde zu machen, so schildert es Max Bernhard von correctiv.org. Marc Ruef wurde als Experte zu Rate gezogen, das Audio auf seine Echtheit zu überprüfen. Laut Ruef weist das im Netz verbreitete Audio mehrere Ungereimtheiten auf. So sind im Allgemeinen keine Umgebungsgeräusche hörbar, die unrein klingenden Töne weisen auf eine schlechte Qualität des Samples hin, oder die Intonation stimmt nicht mit der Atmung überein. Dies seien alles Anzeichen auf ein schlechtes Voice Cloning, so Ruef.
- Die Aufnahme hat generell eine mindere Qualität, was sich in einem Rauschen und Scherbeln bemerkbar macht
- Dies kann einerseits auf schlechte Aufnahmegeräte, aber auch auf eine minderwertige Sprachsynthetisierung zurückzuführen sein
- In der Aufnahme finden sich keine Umgebungsgeräusche und die Distanz zum Aufnahmegerät ist verdächtig konstant
- In den ersten 0.137s ist kein Rauschen zu hören. Dieses Grundrauschen ist dann jedoch in den Pausen stets gleich.
- Es fällt auf, dass dunkle Vokale bei tiefer Intonation besonders scherbeln, was auf Voice Cloning hindeuten kann (z.B. 0:20, 1:10). Kompressionsbedingtes Scherbeln findet sich nämlich in erster Linie bei grellen Lauten
- Ein schlechtes Voice Cloning ist unter anderem daran zu erkennen, dass die für die Intonation erforderliche Atmung nicht korreliert (z.B. es werden lange Aussagen gemacht, ohne zu atmen)
- Es macht den Anschein, als würde im Sample an verschiedenen Stellen geatmet. Dies geschieht aber erst sehr spät, dafür dann unerwartet oft und ähnlich (z.B. 1:04, 1:08, 1:11)
Links
Tags
Sie wollen sehen, was man mit KI und Fake News erreichen kann?
Unsere Spezialisten kontaktieren Sie gern!