KI-Tools können echte Stimmen bereits erstaunlich gut imitieren. Die Branchengröße Eleven Labs etwa benötigt nur eine rund einminütige Stimmaufnahme, um einen Klon zu erstellen, der dem Original beim Vorlesen von Text (Text to Speech) sehr nahekommt. Einzig die Betonung klang bislang etwas hölzern, doch auch dieses Problem gehört dank eines neuen Features der Vergangenheit an. Nach dem Training der Stimme sprechen Sie die Zeilen neuerdings einfach selbst in das Mikrofon – und zwar genau so betont, wie Sie es sich wünschen.
Bei der Umwandlung behält die KI Sprachmelodie, Rhythmus und phonetische Feinheiten bei, um sie auch mit der geklonten Stimme wiederzugeben. Nach ein paar Sekunden Rechenzeit klingt das Resultat fast so, als würde der Besitzer der Originalstimme sprechen. Es scheint, als würde man sich eine fremde Stimme “anziehen”, um mit ihr Podcasts, Radiosendungen, Hörbücher oder Video-Tonspuren aufzunehmen.
In diesem Ratgeber erläutern wir die notwendigen Funktionen, Abomodelle und Tricks, um dem Stimmvorbild möglichst nahezukommen. Eine wichtige Voraussetzung für das Klonen einer Stimme ist natürlich, dass man auch die Rechte daran besitzt, statt den nächstbesten Synchronsprecher zu klonen.
Das war die Leseprobe unseres heise-Plus-Artikels "Eleven Labs: Stimmen nachahmen mit perfekter Betonung".
Mit einem heise-Plus-Abo können sie den ganzen Artikel lesen und anhören.
Immer mehr Wissen. Das digitale Abo für IT und Technik.
Nur bis zum 31. Mai: heise+ 1 Jahr für nur 1,90 pro Woche lesen. Unbegrenzter Zugriff auf alle heise+ Artikel inklusive allen Digital-Magazinen.Länger lesen, mehr sparen: heise+ 1 Jahr lang für nur 1,90 € pro Woche lesen und brandaktuelles IT- und Tech-Wissen sichern. Zugriff auf alle heise+ Artikel inklusive der Digital-Magazine. Nur bis zum 31. Mai!