MiniMax Audio: Eine neue Audio-KI

Screenshot MiniMax Audio

Vor vielen Monaten habe ich hier im Newsletter das KI-Audio-Tool ElevenLabs vorgestellt. Es ist derzeit eine der umfänglichsten Lösungen für Audio-KI. Mit MiniMax Audio bekommt das Tool Konkurrenz.

Was kann MiniMax Audio?

MiniMax ist eine chinesische KI-Firma, in die unter anderen Alibaba und Tencent investiert haben. Neben einem Chatbot und einem Videomodell bietet MiniMax auch ein starkes Audio-Tool an. MiniMax Audio kann geschriebenen Text mit KI-Stimmen für dich einsprechen (Text-to-Speech oder TTS). Es ist zudem möglich, die eigene Stimme zu klonen. Und eine Funktion zur Sprachisolation bietet MiniMax auch an.

Wie nutze ich MiniMax Audio?

Nach dem Login per Google-Account kannst du loslegen. Entweder du fügst direkt deinen Text ein und bedienst dich an der Auswahl von mehr als 300 vorgefertigten Stimmen. Oder du klickst auf Voice Cloning und lädst ein Audiofile der zu synthetisierenden Stimme hoch. Wichtig: Der Anbieter kann das KI-Modell dann im Zweifel mit deiner Stimme trainieren. Für das Klonen genügt in der Regel eine 10-Sekunden-Aufnahme. Danach kannst du deine KI-Stimme verwenden, um Texte vorlesen zu lassen.

Wie viel kostet MiniMax Audio?

Pro Monat können etwa 12 Minuten Audio kostenfrei produziert werden. Mehr Volumen gibt es im Abo ab 4 US-Dollar pro Monat.

Nach oben scrollen