Hauptbild
Nicht schön und der KI-Natur entsprechend auch nicht wirklich selten: das Cover zum ersten ausführlichen KI-Musik-Versuch von Felix Janosa und Dirk Schelpmeier (BoD) greift die KI-Ästhetik grafisch auf. Gestaltung: Ralf Weber

Nicht schön und der KI-Natur entsprechend auch nicht wirklich selten: das Cover zum ersten ausführlichen KI-Musik-Versuch von Felix Janosa und Dirk Schelpmeier (BoD) greift die KI-Ästhetik grafisch auf. Gestaltung: Ralf Weber

Banner Full-Size

Große Göttin Suno – billig, aber kapriziös

Untertitel
Erfahrungen zu Prompts und „Circumstances“ bei der Arbeit mit Musik-KI · Von Felix Janosa
Vorspann / Teaser

Ja, ich bin schuldig! Anstatt wie besorgte Musik-Lehrende, kritische Kultur-Schreibende, die Aufrechten von der GEMA, gestandene Orchesterleiter und sogar (!) die großen Schallplattenfirmen vor den desaströsen Folgen der musik-kreativen KIs zu warnen, habe ich mich auf das bekannteste dieser digitalen Tools gestürzt und hemmungslos damit experimentiert. Oh ja, ich bin schuldig! Für einige Wochen habe ich mich der großen KI-Göttin Suno (so heißt die populärste dieser teuflischen musikalischen Maschinen) hingegeben und bringe ihr demütig Opfer dar. Nicht Obst, Blumen und Räucherstäbchen, sondern eigene Texte, die sie nach bescheidenen inhaltlichen Vorgaben, von Profis Prompts genannt, doch bitte in digital-musikalische Formen gießen möge. Die Göttin Suno verlangt zwar nicht viel Geld für ihre Dienste, aber sie ist kapriziös und unbarmherzig – wenn ihr manche meiner Texte oder Prompts nicht gefallen, lacht sie herzhaft und schüttet einen Sack digitalen Blödsinn über meinem bescheidenen kreativen Haupt aus. Ist sie aber für einen Moment gnädig gestimmt, regnet es musikalische Schönheiten und Merkwürdigkeiten ohne Zahl.

Publikationsdatum
Paragraphs
Text

Doch noch einmal ganz von vorne: Während Elon Musk gerade seine neuesten Humanoiden bewirbt, die Omas über die Straße helfen, eine Fußball-Fankurve in Schach halten oder zur Not sogar ein Risotto kochen können, ist KI ohne menschliche Hülle längst Teil unseres Alltags geworden. Von den Hausaufgaben über medizinische Diagnosen bis zu industriellen Arbeitsabläufen verlassen wir uns längst auf die magisch anmutenden Streifzüge der Rechner durch Myriaden von Lösungsmöglichkeiten.

KI-Zeitalter

Dies krempelt Industrien um und hat Auswirkungen auf Arbeitsplätze. Die direkten Folgen für den kreativen Bereich konnte man bereits im Bereich der generativen Fotografie erkennen: Stock-Portfolios wurden von KI-Usern geflutet, Marktführer Adobe sah sich gezwungen, den Zustrom von digital generierten Fotos zu drosseln. Und nun erfolgt seit etwa einem Jahr der massive digitale Angriff auf die Musik – Stücke werden komplett komponiert und arrangiert, mit digitalen Instrumenten und Stimmen versehen.

Die gute Nachricht zuerst: Auch mit den neuen Möglichkeiten der selbstständig komponierenden Musik-KIs wird die handgemachte Musik nicht aussterben. Die schlechte hinterher: Die neuen Musik-KIs sind ein Erdrutsch, der die digitale Musikproduktion gerade exponentiell vermehrt und – analog zu den Stockfoto-Portalen – Audio-Online-Portale wie Spotify überschwemmt.

KI-Musik im Selbstversuch

Die naheliegende Frage war bei mir eine handwerkliche: Sind die von einer Musik-KI ausgespuckten Ergebnisse kompositorisch und arrangiertechnisch gelungen? Und können sie es auch mit Songs von erfahrenen Künstlern oder Künstlerinnen aufnehmen? Die selbst gestellte Aufgabe meines Experiments war anspruchsvoll: Die Generierung eines kompletten Swing-Albums mit 16 zeitgemäßen Songs in deutscher Sprache, eigene Texte, dazu Big Band-Arrangements.

Die Suno AI wurde von vier Programmierern in Cambridge (USA) entwickelt, die erste überzeugende Version (v3) steht Online-Usern seit März 2024 zur Verfügung. Gratis darf man in diese AI zwar hineinschnuppern, doch eine kommerzielle wie professionelle Nutzung wird erst mit einem Abo für rund 10 Dollar im Monat gestattet. Wer das Programm zum ersten Mal nutzt, wird ein wenig geschockt sein, denn in nur 20 bis 40 Sekunden generiert Suno einen kompletten Song in zwei alternativen Fassungen, Länge bis zu fünf Minuten. Auch der Text wird je nach individuellem Prompt („Bitte schreib mir eine romantische Pop-Ballade, die davon handelt, wie sich zwei Menschen beim Entenfüttern auf den ersten Blick verlieben.“) dazu erfunden, auf Deutsch, Englisch, Mandarin, egal. Vorstellungen von musikalischer Stimmung, Genre, Tempo oder Titel des Songs geben eine grobe Richtung vor, und dann geht es los. Kleine Korrekturen in Text und Musik sind möglich, dauern aber erheblich länger und verbrauchen wahrscheinlich den monatlichen Strombedarf einer Kleinstadt.

Bild
KI-Grafik: Gerd Altmann Notenmontage: Mathis Ubben

KI-Grafik: Gerd Altmann
Notenmontage: Mathis Ubben

Text

Die ersten Bedienungsübungen ohne vorgegebene Texte brachten mainstream-orientierte Ergebnisse, die zwar verblüfften, mich wegen der klischeehaften KI-Texte und der ausschließlich chart-orientierten Machart aber nicht wirklich berührten. Ganz anders wurden die Ergebnisse, als wir, ein Trio aus mir, dem Songwriter Dirk Schelpmeier und dem Aachener Tontechniker Tom Engels, Suno mit eigenen Texten und genauen Formteil-Vorgaben (Verse 1, Chorus, Bridge, Solo et cetera) fütterten. In Verbindung mit einem detaillierten Prompt (zum Beispiel „Big Band, 1950er Jahre, weibliche Stimme, Klarinetten-Solo“ et cetera) erhielten wir Titel, die in puncto Swing, stilsicherem Arrangement, sängerischer Interpretation und sinnvoller Textverteilung zunächst einmal keine Wünsche offen ließen. Krass erschien uns auch die Arbeits-Ersparnis: Denn ohne KI ein ähnlich aufwändiges Big Band-Arrangement für nur einen Titel zu schreiben, wäre für den erfahrenen Profi-Arrangeur Arbeit für zwei bis drei Tage, von den Aufnahme-Kosten für eine wirklich swingende Big Band einmal ganz zu schweigen.

Kommunikationsdesaster

Doch nun zum Knackpunkt, dem Wörtchen „zunächst“: Wie erwähnt gibt es bei Suno zwar in den aktuellen Versionen auch Möglichkeiten zur nachträglichen Korrektur, aber hier erwies sich das Programm als sperrig, die Eigenwilligkeit dieser „KI-Göttin“ empfanden wir als enorm. Es war ein bisschen wie früher in der Jugend das Hoffen auf den Inhalt einer teuren Wundertüte, in der aber leider nur das war, was man nicht wollte.

Für unsere 16 Titel, die wir auf dem Album „Über Nacht KI-Star, Swing-Schlager“ versammelt haben, benötig­ten wir weit über 150 Versuche. Viele Texte mussten nach ersten Fehlversuchen modifiziert und den vermeintlichen „Wünschen“ der KI angepasst werden, andere Textvorschläge funktionierten überhaupt nicht. Bei vielen Texten, die wir selbst für gelungen hielten, blieb trotz ständig variierender Prompt-Eingabe den Algorithmen unklar, wie wir Tempo, Textverteilung, musikalische Gestaltung angedacht hatten. Neben einer offensichtlichen Unwilligkeit, bekannte Genrevorschläge wie „Cha Cha“ oder „Boogie“ anzunehmen, gesellte sich bei Suno Ahnungslosigkeit von Musiktheorie und harmonischer Schlüssigkeit: Unmotiviert setzte die KI zuweilen dort platt einen Akkord hin, wo nach Gefühl und „harmonischen Regeln“ ein ganz anderer hingehört hätte. Und: Die KI schaute immer nur „bis zur nächsten Ecke“: Auch wenn ein Formteil in sich schlüssig war, konnten bereits im nächsten Teil musikalische Kapriolen folgen, die mit dem Bisherigen rein gar nichts zu tun hatten.

Nerviges Wunderkind

Zuweilen hatten wir beim Hin und Her mit immer neuen Textvorschlägen und ständig modifizierten Prompts das Gefühl, es mit einem gleichzeitig hochbegabten wie nervigen Wunderkind zu tun zu haben, dem trotz enormen Könnens die wichtigsten Tugenden für das Komponieren fehlten: Konsequenz, Klarheit und Geschmack. Ein weiterer wichtiger Aspekt, der uns auffiel, war der immer gleiche Zugriff auf bereits benutzte Genre-Muster: Nach dem sechsten oder siebten Titel, der von einem männlichen KI-Interpreten zur Big Band-Begleitung gesungen wurde, waren wir die stereotype Art der Interpretation und Arrangement-Gestaltung leid und entschieden uns, auch weibliche Solo-Stimmen auszuprobieren und bestellten neben „Big Band-Swing“ ganz andere Genres wie „Salsa“ oder „Surf-Rock“.

Nur ein stummer „Schrei nach Liebe“?

Ende gut, alles gut: Durch Sitzfleisch, beharrliches Verwerfen und Neu-Auswählen sowie heftiges Editieren von KI-Vorschlägen waren wir irgendwann mit unseren 16 Titeln zufrieden. Und angesichts der überschaubaren Investition von Man-Power und Geld konnten wir sogar behaupten: eine Hammer-Produktion! Teilweise waren wir richtig geflasht von dem Sentiment, das manche KI-Songs bei uns freisetzten.

Die Umsetzung der Texte ging in den lichten KI-Momenten weit über die reine Stil-Imitation hinaus, die Baustein- und Abgleichmethode der Algorithmen drang tiefer in die musikalische Syntax vor als ein mittelmäßiger Musikbastler, der einen guten Songtext durch Standard-Klischees verdirbt.

Dass die KI dies vor allem mit juris­tisch fragwürdigen Raubzügen durch das Netz schafft, wurde uns an der Umsetzung eines speziellen Songtextes besonders klar: Hier lieferte uns Suno ungefragt ein perfektes Stil-Imitat der „Ärzte“, obwohl wir im Prompt nach etwas anderem gefragt hatten. Des Rätsels Lösung: Das im Songtext auftauchende Wort „Arschloch“ hatte die künstliche Intelligenz zielsicher auf die Spur der drei Berliner Edel-Punker und ihren Song „Schrei nach Liebe“ gebracht.

Die Frage, ob wir in Zukunft Prompt­-Virtuosen und KI-Beschwörende werden müssen, stellt sich aktuell für Menschen mit gestandenem musikalischen Handwerk nicht, die musikalischen KIs sind Helferchen, die man zwar für unliebsame Nebenjobs nutzen, aber kaum als Ersatz für ein persönliches Musikschaffen ertragen kann.

Bild
Nicht schön und der KI-Natur entsprechend auch nicht wirklich selten: das Cover zum ersten ausführlichen KI-Musik-Versuch von Felix Janosa und Dirk Schelpmeier (BoD) greift die KI-Ästhetik grafisch auf. Gestaltung: Ralf Weber

Nicht schön und der KI-Natur entsprechend auch nicht wirklich selten: das Cover zum ersten ausführlichen KI-Musik-Versuch von Felix Janosa und Dirk Schelpmeier (BoD) greift die KI-Ästhetik grafisch auf. Gestaltung: Ralf Weber

Text

Ideale KI-Bedingungen in der Popindustrie

Wie das mit Nicht-Musikern oder Noch-Nicht-Musikern aussieht, wird die Zukunft zeigen. Denn Suno und Co werden die Musik-Kreativität in grundlegender Art und Weise verändern. Einerseits halten sie potentielle Musik-Kreative vom korrekten „hard way“, dem stundenlangen Üben, Proben und analogen Arrangieren beziehungsweise Komponieren ab, denn – dies ist unsere eigene Erfahrung – diese Apps machen süchtig und faul. Zum anderen legen diese KIs die Messlatte für durchschnittliche Gebrauchsmusik sehr hoch: Wenn ich eine musikalische KI bitte, mir Werbemusik für die Traktorfirma oder 50 Sekunden für den „Tatort“ zu machen, ist das Künstliche in 90 Prozent aller Fälle schneller, besser und deutlich billiger.

Was die unausweichliche Übernahme der Gebrauchsmusik durch GEMA-freie und damit billige digitale Ersatzmusik mit den Hörenden macht, ist zum gegenwärtigen Zeitpunkt nicht zu prognostizieren. Da bereits seit zwei Jahrzehnten in Pop- und Gebrauchsmusik ein – euphemistisch gesprochen – niederschwelliges Niveau herrscht, denke ich nicht, dass die meisten Hörer den Wechsel zur umfassenden Digitalisierung überhaupt noch wahrnehmen. Natürlich ist Musik immer auch mehr als nur Ton, Geräusch oder Text, doch die Zeiten, in denen populäre Musik wirklich Lebenskultur, Gruppenbildung und relevantes soziales Phänomen bedeutete, gehören der Ära von Diedrich Diederichsen an. Statt Content regieren die Content-Player, die wirklichen Must-Haves unserer Zeit: iPhone 16, Samsung Galaxy S25 Ultra oder Google Pixel 9 Pro.

Und egal, wie sich Musikindustrie und KI-Hersteller in Zukunft einigen werden: Diese generativen Musik-KIs haben schon jetzt nicht absehbare Folgen für die Musikszene. Denn wer braucht irgendwann noch echte Musiker außer für die Live-Situation? Und wie können wir Kinder künftig noch davon überzeugen ein Instrument zu lernen? Denn dieser musikalische Zauberkasten macht – das mussten wir uns leider eingestehen – viel Spaß, birgt jedoch die Gefahr, ihm die musikalische Kreativität aus Bequemlichkeit zu überlassen.

Weiterlesen mit nmz+

Sie haben bereits ein Online Abo? Hier einloggen.

 

Testen Sie das Digital Abo drei Monate lang für nur € 4,50

oder upgraden Sie Ihr bestehendes Print-Abo für nur € 10,00.

Ihr Account wird sofort freigeschaltet!