
Warum empfinden wir KI-generierte Musik als problematisch? Kann ich Musik schätzen und wertschätzen, wenn kein menschlicher Schöpfer dahintersteht? Ist die Abneigung gegen KI-generierte Musik nichts weiter als gekränkter menschlicher Stolz? Unser Autor René Wynands stellt sich diese und andere Fragen, nachdem er unwissentlich ein Album rezensiert hat, das wahrscheinlich von einer KI generiert wurde. Damit hat er eine grundlegende Debatte ausgelöst.
Text: René Wynands
In der letzten Heft-Ausgabe der Riddim schrieb ich eine Review des aktuellen Haris-Pilton-Albums ”Think Dubby”, das mir ganz gut gefiel. Eine von Tausenden Reviews, die ich in meinem Leben geschrieben habe. Und doch war sie es, die eine ziemliche Kontroverse im Dubblog losgetreten hat, denn mir war nicht aufgefallen, dass Haris Pilton zur Produktion seiner Dubs offenbar künstliche Intelligenz verwendet hatte. Zumindest wurde dieser Vorwurf erhoben – wenn auch nicht bewiesen. Andererseits hat Haris auch nicht eindeutig dementiert, sodass in der Tat davon auszugehen ist, dass KI im Spiel war.

Zum Glück traf es bei dem Disput weniger mich und meine Review. Die war eigentlich nur der Anlass, um Haris Pilton schwere Vorwürfe zu machen. Er würde die Dub-Community betrügen und unser heiliges Genre entehren.
Während sich in manchen Genres niemand wirklich darum zu scheren scheint, ob bei der Produktion KI involviert ist, macht es zumindest bei Dub offenbar einen Riesenunterschied zwischen ”ehrlicher” Musik und Musikbetrug.
Ich muss zugeben, dass auch ich etwas schockiert war und leise an meiner Dub-Kompetenz gezweifelt habe. Wie konnte ich nicht hören, dass die Dubs KI-generiert waren? Wie konnte mir das entgehen? In der Tat schwankt die Qualität der Pilton-Produktionen ziemlich stark, und sein Oeuvre erscheint zudem stilistisch disparat. Das hätte mich skeptisch machen sollen. Zudem wirkt das Album ”Think Dubby” selbst nicht sehr geschlossen. Es gibt brillante Tracks, aber auch einige schlechtere, die aus dem Rahmen fallen.
Erst im Nachgang fragte ich mich, warum es eigentlich einen solchen Unterschied macht, ob Dub KI-generiert ist oder ”handwerklich” produziert wurde. Mein Motto lautet eigentlich, ganz nach Helmut Kohl: ”Es zählt, was hinten raus kommt”. Dazu stehe ich auch: Letztlich zählt das, was wirklich zu hören ist. Ein Werk ist gut oder schlecht, ganz egal, wie es zustande kam, welche Technik eingesetzt wurde, wer es erzeugt hat, ob viel oder wenig Geld, viel oder wenig Zeit, viel oder wenig Talent investiert wurde. Informationen darüber mögen unsere Rezeption beeinflussen und uns dabei helfen, ein Werk besser zu verstehen. Aber an der Qualität der Musik ändert es nichts, denn der Schall, der an unsere Ohren dringt, bleibt gleich – ganz egal, was wir darüber wissen. Also müssen wir die Qualität eines Musikstücks ohne all das Vorwissen beurteilen können, nur auf Basis dessen, was wirklich da ist: die pure Musik. So gesehen spielt es keine Rolle, ob echte Musiker und Musikerinnen am Werk waren, ob digital mit Logic Pro produziert wurde, ob gesampelt wurde oder ob die Musik KI-generiert ist, oder?
Merkwürdig, dass es trotzdem nicht so ist. KI-Musik vom Brighton Dub Club oder von Full Dub Riddims höre ich mir nicht gerne an. Da regt sich ein Widerwille in mir – und offenbar auch in vielen anderen Dub-Freunden. Woran liegt das?
Erklärungsversuch 1
Eine Erklärung könnte sein, dass KI-Dubs ein betrügerischer Rip-off menschlicher Musiker und Musikerinnen sind, denn die KI wurde ja mit dem Material menschlicher Musikschaffender trainiert – ohne dass diese dafür entlohnt wurden. Dieses Argument ist oft von Kreativen unterschiedlicher Disziplinen zu hören: Grafiker:innen, Illustrator:innen, Fotograf:innen, Texter:innen, Videograf:innen, Schriftsteller:innen und vielen mehr. Diese haben viel Zeit und Mühe in das Erlernen ihrer Fähigkeiten investiert – und nun nimmt die KI ihnen die Jobs weg. Das gelingt der KI perfiderweise nur deshalb, weil sie ihre Fähigkeiten an den Werken der Kreativen ”trainiert” hat. Juristisch läuft das auf die Frage hinaus, ob die KI-Hersteller zum Training ihrer Modelle widerrechtlich urheberrechtlich geschütztes Material verwendet haben. Das ist Gegenstand aktueller juristischer Diskussionen, und wir werden wohl bald erfahren, ob OpenAI, Google, Anthropic und die anderen eine Art ”GEMA” werden nachzahlen müssen.
Das generelle Prinzip des Lernens anhand der Werke anderer ist jedenfalls nicht schändlich. Denn was macht die KI denn eigentlich anders als menschliche Schüler:innen, die von den Werken großer Meister lernen? Ist es nicht ganz normale Ausbildungspraxis, dass an den Werken anderer die eigenen Fähigkeiten trainiert werden? Wir trainieren prinzipiell genauso wie eine KI es tut, indem wir uns die Werke anderer anschauen, sie analysieren und studieren. Abgesehen davon, dass wir dabei um Dimensionen effizienter lernen, ist es genau dasselbe, was die KI macht. Allerdings – das ist ein wesentlicher Unterschied – haben wir zuvor Geld für einen Museumsbesuch, ein Buch oder ein Spotify-Abo ausgegeben. Wir haben also – über Umwege – die Kreativen dafür bezahlt, dass wir ihre Werke studieren durften.
Dass wir uns der Werke anderer bedienen, wird noch viel deutlicher beim Sampling, bei Collagen oder ”Zitaten”. Hier wird regelrecht kopiert – was aber gemeinhin akzeptiert ist. Gut gewählte Samples werden sogar anerkennend gelobt, ein cleveres Zitat geschätzt, und Collagen gelten als eigenständige künstlerische Werke. Warum also, verdammt noch mal, haben wir ein Problem mit KI-generierten Dubs?
Ist es nicht ganz normale Ausbildungspraxis, dass an den Werken anderer die eigenen Fähigkeiten trainiert werden? Wir trainieren prinzipiell genauso wie eine KI es tut, indem wir uns die Werke anderer anschauen, sie analysieren und studieren. […] Allerdings – das ist ein wesentlicher Unterschied – haben wir zuvor Geld für einen Museumsbesuch, ein Buch oder ein Spotify-Abo ausgegeben. Wir haben also – über Umwege – die Kreativen dafür bezahlt, dass wir ihre Werke studieren durften.
Erklärungsversuch 2
Vielleicht ist es gekränkte Eitelkeit, weil sich niemand wirklich die Mühe gemacht hat, die Musik zu erschaffen, der ich meine Zeit widme, um sie aufmerksam zu hören? Kann ich Musik genießen, wenn es keinen Artist gibt, dem es um mich als Hörenden geht? Wenn da niemand ist, der mir gefallen will, der sich um mein Vergnügen bemüht, der mir im besten Fall etwas mitzuteilen hat? Kurz: Kann ich Musik genießen und wertschätzen, wenn kein menschlicher Schöpfer dahintersteht?
Bei einer idyllischen Landschaft ist das seltsamerweise kein Problem. Auch hinter ihr steht kein menschlicher Schöpfer, und doch genießen und schätzen wir sie inbrünstig. Das gilt auch für andere Naturschönheiten. Wie faszinierend ist der Anblick mancher Pflanzen oder Tiere, die ebenfalls nicht das Werk eines Künstlers oder einer Künstlerin sind. Warum sollte das bei Musik, Malerei oder Film anders sein? Vielleicht schafft es eine wirklich gute KI in Zukunft, nur noch gute Musik zu komponieren. All killer, no filler! Was wäre dagegen einzuwenden?
Erklärungsversuch 3
Vielleicht muss man etwas tiefer in der Psyche des westlichen Menschen graben, um eine Erklärung für das Unbehagen zu finden, das uns befällt, wenn wir KI-Musik oder KI-Kunst vor uns haben. Also starten wir mal bei Sigmund Freud. In seiner Arbeit ”Eine Schwierigkeit der Psychoanalyse” aus dem Jahre 1917 beschreibt Freud die Widerstände, die der von ihm entwickelten Psychoanalyse seiner Auffassung nach entgegenstehen. Wie jede wissenschaftliche Neuerung müsse auch sie sich gegen etabliertes Denken durchsetzen – nicht zuletzt deshalb, weil durch sie ”starke Gefühle der Menschheit verletzt worden sind”.
Freud nennt drei große Kränkungen des menschlichen Narzissmus: die kosmologische Kränkung durch Kopernikus, der den Menschen aus dem Mittelpunkt des Weltalls vertrieb; die biologische Kränkung durch Darwin, der den Menschen in die Reihe der Tiere stellte; und schließlich die psychologische Kränkung durch Freud selbst, der dem Ich erklärte, es sei ”nicht Herr im eigenen Haus”.
Seitdem sind weitere Kränkungen hinzugekommen. Die Neurobiologie hat die alte Trennung von Körper und Geist zumindest stark erschüttert. Das Ich, das wir so gerne als autonome Instanz begreifen, erscheint immer mehr als Funktion eines Körpers, der von Chemie, Biologie, Trieben, Routinen und unbewussten Prozessen bestimmt wird.
Und nun kommt, ziemlich aktuell, die nächste Zumutung hinzu: Auch Intelligenz und Kreativität sind offenbar nicht mehr exklusiv menschlich. Maschinen schreiben Texte, malen Bilder, komponieren Musik, entwerfen Designs, erzeugen Stimmen, imitieren Stile und lösen Probleme, für die wir bis vor Kurzem noch Begabung, Bildung, Erfahrung oder wenigstens ein empfindsames Innenleben vorausgesetzt hätten.
Das kränkt. Natürlich kränkt das. Denn es nimmt uns eine weitere Bastion, auf der wir es uns lange bequem gemacht hatten. Wenn eine Maschine plötzlich ein Dub-Album erzeugen kann, das zumindest auf den ersten Blick funktioniert, dann stellt das nicht nur die Maschine zur Diskussion, sondern auch unsere Vorstellung davon, was menschliche Kreativität eigentlich ist. Wer mag sich schon unbefangen an einem Werk erfreuen, das zugleich den Verdacht nahelegt, dass einige unserer heiligsten Unterschiede zwischen Mensch und Maschine vielleicht weniger stabil sind, als wir dachten?
Wenn eine Maschine plötzlich ein Dub-Album erzeugen kann, das zumindest auf den ersten Blick funktioniert, dann stellt das nicht nur die Maschine zur Diskussion, sondern auch unsere Vorstellung davon, was menschliche Kreativität eigentlich ist.
Aber diese Erklärung reicht nicht aus. Der Widerstand gegen KI-Musik ist nicht bloß verletzter Stolz. Er ist auch nicht einfach die beleidigte Reaktion einer Spezies, die feststellen muss, dass sie Konkurrenz bekommen hat. Viele Einwände gegen KI sind sehr viel handfester. Musiker:innen, Produzent:innen, Grafiker:innen, Autor:innen und andere Kreative fürchten nicht nur, dass Maschinen besser werden könnten als sie. Sie fürchten, dass Plattformen, Labels, Streamingdienste und Content-Farmen KI nutzen, um menschliche Arbeit zu entwerten, Honorare zu drücken, Rechte zu umgehen und Kultur in massenhaft verfügbaren, jederzeit austauschbaren Stimmungsbrei zu verwandeln.
Das ist keine bloße narzisstische Kränkung, sondern eine reale Machtfrage. Wer besitzt die Trainingsdaten? Wer verdient an den Modellen? Wer wird ersetzt, wer wird bezahlt, wer bleibt sichtbar? Wer kann es sich leisten, menschliche Kreativität weiterhin als kostbares Gut zu behandeln, wenn synthetische Alternativen billiger, schneller und beliebig skalierbar sind? In diesem Sinne ist das Unbehagen an KI-Musik auch ein Misstrauen gegenüber den ökonomischen Strukturen, in denen diese Musik entsteht und verbreitet wird. Vielleicht richtet sich unser Widerwille also gar nicht nur gegen die Maschine selbst, sondern gegen die Welt, die sie hervorbringt und die sie aller Wahrscheinlichkeit nach noch effizienter, glatter und rücksichtsloser machen wird.
Trotzdem bleibt die psychologische Kränkung ein wichtiger Teil des Problems. Denn selbst wenn alle rechtlichen Fragen geklärt wären, selbst wenn Musiker:innen fair vergütet würden, selbst wenn transparent gekennzeichnet wäre, welche Musik KI-generiert ist und welche nicht, bliebe vermutlich ein Rest Unbehagen. Die Vorstellung, dass Kreativität aus Wahrscheinlichkeiten, Mustern und Kontextfenstern entstehen kann, ohne Erfahrung, Verletzlichkeit, Langeweile, Sehnsucht oder Weltbeziehung, widerspricht unserem eingeübten Kunstverständnis. Wir wollen hinter einem Werk jemanden vermuten: ein Subjekt, eine Absicht, einen Körper, ein Leben. Die KI aber liefert womöglich ein Resultat, ohne diese Geschichte mitzuliefern. Und genau darin liegt ihre Zumutung.
Erklärungsversuch 4
Womit wir beim Thema der Künstler:innen-Persönlichkeit wären.
Seit Tausenden von Jahren sind wir als Menschen darauf geprägt, dass kulturelle und künstlerische Werke von begabten Individuen stammen. Galten die Künstler früher als Handwerker, so entstand im 18. Jahrhundert die Idee des Künstlergenies. Dieses wird bis heute als originelles, schöpferisches Individuum verstanden, das aus innerer Kraft Neues hervorbringt. Ihren Höhepunkt erreicht diese Vorstellung in der Romantik um 1800: Der Künstler wird fast zu einer visionären, außergewöhnlichen Figur mit besonderem Zugang zu Wahrheit, Natur oder dem Absoluten. Kunst erschien als Ausdruck einer besonderen inneren Kraft. Dieser ”Künstlermythos” besteht – abgeschwächt – bis heute fort und prägt unseren Blick auf Kunst und Kultur. Auch wenn aus dem einsamen Schöpfergenie zunehmend eine Figur im Geflecht aus Gesellschaft, Markt, Technik und Zusammenarbeit wurde, so fällt es uns aktuell extrem schwer, Kunst als etwas zu verstehen, das womöglich ohne menschlichen Schöpfer bzw. ohne menschliche Schöpferin auskommt.
Hinzu kommt, dass Kunst jahrhundertelang vornehmlich im Dienste der Religion stand. Ihre Aufgabe bestand darin, die Narrative der Religion zu mythisieren. Kunst und Religion sind also seit je her eng miteinander verknüpft. Als mit der Moderne diese Funktion zunehmend in den Hintergrund trat, begann die Kunst im Zuge ihrer ”Befreiung”, sich selbst zu mythisieren, zu überhöhen und zu verherrlichen. Die Kunst wurde somit selbst zu einer Religion – und Künstler zu ihrem Priestern.
Wenn wir diese Vorstellung von Kunst und Künstler:innen nun angesichts der KI über den Haufen werfen wollen, müssen wir gegen die seit Jahrhunderten etablierte Prädisposition ankämpfen, an höhere Ordnungen, Autoritäten und Sinnsysteme zu glauben und an charismatische Führer – seien es Kleriker, Herrscher oder eben Künstler. Dieser Glaube hat uns all die Zeit Sinn, Schutz, Ordnung, Zugehörigkeit und Entlastung ermöglicht – und jetzt sollen wir angesichts denkender Maschinen davon ablassen? Wie können wir das alles einfach so infrage stellen, weil wir plötzlich lernen, dass unter anderem Kunst ohne die traditionellen Autoritäten der Kunst, auskommt?

Erklärungsversuch 5
Hinzu kommt noch ein weiterer arger Verlust: der Verlust des Kunstwerkes.
Wir Vinylsammler taten uns schon extrem schwer damit, von der physischen, haptischen Repräsentation eines musikalischen Werkes abzulassen und stattdessen ein MP3-File im iTunes-Store zu kaufen – immerhin hatten wir diese Datei dann noch auf unserer Festplatte liegen. Durch das Streaming ist uns auch dieser Besitz abhandengekommen. Musik wurde zu einem immateriellen Gut. Aber immerhin existiert ja noch das Werk in Form eines Albums oder zumindest eines Musikstückes, als kleinste Entität in unserer Spotify-Mediathek.
Aber stellen wir uns mal vor, wie es in vielleicht fünf Jahren aussehen wird, wenn die Spotify-KI keine Songs mehr vorproduzieren muss, wie es aktuell noch der Fall ist, sondern sie ”on the fly”, also in Echtzeit, generieren kann. Wenn also der Spotify-Stream, anders als jetzt, nicht mehr zum Großteil aus vorproduzierten KI-Stücken besteht, sondern aus einem Flow in Echtzeit generierter Musik, die exakt auf unseren Geschmack hin designt ist. Die Musik gäbe es dann tatsächlich nur im Moment ihrer Entstehung. Damit wäre auch die virtuelle Musiksammlung einer Mediathek passé, und mit dem Artist hätte sich auch das Werk verflüchtigt.
Eine Dystopie?
Dann lasst uns diesen Artikel in die Bookmarks speichern und in fünf Jahren noch mal lesen. Ich bin selbst gespannt, wie es dann um unsere Lieblingsmusik bestellt sein wird.
Jedenfalls – ich glaube, das ist deutlich geworden – bin ich nicht davon überzeugt, dass KI-Musik und insbesondere KI-Dubs per se böse sein müssen. Es ist vielmehr unsere psychische Verfasstheit – narzisstische Kränkung, Kunstglaube, Verlustängste –, die uns im Weg steht, die vermeintlichen Qualitäten von KI-Musik zu sehen und anzunehmen.
Ich muss sagen, dass es mir selbst schwerfällt, dies zu schreiben.
Weiter: Lasst uns ohne Vorurteile auf die aktuelle Musikproduktion und die der Zukunft blicken. Lasst uns genau hinhören und allein an dem, was in unsere Ohrmuscheln dringt, entscheiden, ob es sich um gute oder um schlechte Musik handelt. ”None of us can stop the time”.
Oder
Versöhnungsversuch
Dabei liegt genau hier vielleicht der eigentliche Widerspruch.
Einerseits bleibt der Schall derselbe. Ein Basslauf wird nicht schlechter, nur weil ich nachträglich erfahre, dass ihn keine Bassistin und kein Bassist eingespielt hat. Ein Echo verliert nicht messbar an Tiefe, weil es aus einem Algorithmus stammt. Der Hallraum schrumpft nicht physikalisch zusammen, sobald ich weiß, dass ihn niemand mit den Händen am Mischpult geöffnet hat. Was an mein Ohr dringt, bleibt identisch.
Und doch hören wir Musik offenbar nie nur als reinen Schall. Wir hören sie immer auch als Spur einer Praxis, einer Haltung, einer Szene, einer Geschichte.
Gerade bei Dub ist das schwer auszublenden. Dub ist ja nicht bloß eine Klangästhetik aus Bass, Hall, Echo, Drop-outs und Delay-Schleifen. Dub ist Studiohandwerk, Sound-System-Kultur, Improvisation, Materialbearbeitung, soziale Herkunft, Körperlichkeit und Raumgefühl. Dub lebt davon, dass jemand ein meist vorhandenes Material anfasst, auseinandernimmt, neu zusammensetzt, in die Tiefe zieht, verschwinden lässt und wieder auftauchen lässt. Im besten Fall hört man nicht nur ein Ergebnis, sondern einen Vorgang: Hände am Mischpult, Entscheidungen im Moment, Mut zur Lücke, Lust am Risiko, manchmal auch die charmante Unvollkommenheit einer Idee, die gerade deshalb lebendig wirkt.
Wenn KI-Dub dieses ganze Beziehungsgeflecht nur nachbildet, ohne tatsächlich daran teilzunehmen, entsteht womöglich ein Mangel, den man nicht unbedingt im Frequenzspektrum nachweisen kann. Vielleicht klingt alles ”richtig”: der Bass warm, die Snare trocken, das Delay schön versetzt, die Melodica an der passenden Stelle. Und trotzdem fehlt etwas. Nicht, weil die Maschine den falschen Sound gewählt hätte, sondern weil der Sound keine Geschichte mehr mitbringt – oder jedenfalls keine, an die ich glauben kann. Das Defizit liegt dann nicht im Klang selbst, sondern in der Bedeutung des Gehörten. Es ist kein akustischer, sondern ein kultureller Verlust.
Gerade Dub war immer mehr als ein Sound. Er war eine Methode, ein Ort, eine Haltung zur Welt. Und genau deshalb trifft uns KI-Dub vielleicht empfindlicher als KI-Fahrstuhlmusik. Er imitiert nicht nur eine Oberfläche, sondern eine kulturelle Praxis, die für viele von uns mit sehr viel mehr aufgeladen ist als mit ein paar hübschen Echoeffekten.
Das macht die Sache komplizierter, als mir lieb ist. Denn wenn ich sage: ”Es zählt nur, was hinten raus kommt”, dann reduziere ich Musik auf ihr hörbares Resultat. Das ist als Gegenmittel gegen Vorurteile sinnvoll. Aber vielleicht ist es zugleich zu wenig. Vielleicht besteht ein musikalisches Werk eben nicht nur aus Schwingungen in der Luft, sondern auch aus den Beziehungen, die sich in ihm verdichten: zwischen Musiker:innen, Technik, Tradition, Szene, Publikum, Geschichte und Gegenwart. Gerade Dub war immer mehr als ein Sound. Er war eine Methode, ein Ort, eine Haltung zur Welt. Und genau deshalb trifft uns KI-Dub vielleicht empfindlicher als KI-Fahrstuhlmusik. Er imitiert nicht nur eine Oberfläche, sondern eine kulturelle Praxis, die für viele von uns mit sehr viel mehr aufgeladen ist als mit ein paar hübschen Echoeffekten.
Ihr seht mich also von Widersprüchen zerrissen.
Lasst uns gerne einen Diskurs über diese Fragen führen. In jedem Fall aber gilt: Wir werden sehen, was kommt. Ich bin überzeugt davon, dass Reggae und Dub so starke musikalische Ideen sind, dass sie auch unter veränderten Produktionsbedingungen Bestand und Kraft haben werden. Aber das geschieht nicht von allein. Wenn Dub mehr bleiben soll als eine hübsch hallende Stiloberfläche, dann müssen wir weiter darüber streiten, was ihn wirklich ausmacht.
Vielleicht zählt am Ende tatsächlich, ”was hinten raus kommt”. Aber was da herauskommt, ist nie nur Schall. Es ist auch Geschichte, Haltung, Herkunft, Praxis, Versprechen, Täuschung, Sehnsucht und manchmal eine Kränkung, die wir erst verstehen müssen, bevor wir sie überwinden können.
Übrigens ist vor kurzem ”Haris Pilton: Think Dubby, Vol. 2” erschienen. Mir gefällt’s.

