
xAI verbessert sein Audio-Angebot und für die Voice Library und Custom Voices ein. Nutzer sollen ihre eigene Stimme mit einer kurzen Aufnahme klonen und danach direkt in Text-to-Speech- sowie Voice-Agent-Anwendungen einsetzen können.
Laut xAI reicht dafür schon rund eine Minute natürliche Sprache. Die geklonte Stimme soll dann nicht nur für klassische Sprachausgabe taugen, sondern auch mehrsprachige Ausgaben, Speech Tags sowie REST- und WebSocket-Streaming unterstützen. Ergänzend gibt es mit der Voice Library einen zentralen Ort in der xAI-Konsole, um eigene und integrierte Stimmen zu verwalten.
Voice Cloning is now live via the xAI API!
Create a custom voice in less than 2 minutes or select from our library of 80 voices across 28 languages to personalize your voice agents, audiobooks, video game characters, and more.https://t.co/EjxjXssQtd pic.twitter.com/iR8AW2UOgo
— xAI (@xai) May 1, 2026
Interessant ist aus meiner Sicht vor allem der Sicherheitsansatz. xAI setzt hier auf eine zweistufige Verifikation mit gesprochenem Passphrase-Check und einem Abgleich der Sprecherähnlichkeit. Nach Angaben des Unternehmens soll es damit nicht möglich sein, einfach bestehende Aufnahmen oder fremde Stimmen zu missbrauchen.
Die integrierte Bibliothek umfasst laut xAI inzwischen mehr als 80 Stimmen in 28 Sprachen. Zusätzliche Kosten für die Nutzung von Custom Voices innerhalb der TTS- und Voice-Agent-APIs sollen nicht anfallen.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.

