Warum wir beim Jazz mit der KI das Misstrauen verlieren

Dieser Text handelt nicht von Technik.
Er handelt davon, was Sprache und Musik erst dann werden, wenn sie etwas kosten.
( Die Bilder sind KI erzeugt, noch sind es fiktive Situationen)

Rickmerstraße bei Nacht: Sprache ist keine Information

Ein japanischer Tourist hat sich in Bremerhaven verlaufen.
März. Schmuddelwetter. Nieselregen, der nicht richtig kalt ist, aber trotzdem unangenehm. Er kam mit einem Kreuzfahrtschiff, interessiert an Fischtown. Mit Fischen kennt er sich aus. Die Nacht ist tief, der neue Tag hat chronologisch bereits begonnen. 24:30 Uhr.

Die Straße, die er entlanggeht, ist überraschend hell. Er hofft auf Passanten, die ihm den Weg zurück zeigen können. Eigentlich mag er diese nächtliche Szenerie. Sie wirkt ruhig, fast freundlich.

Zur gleichen Zeit ist ein Bremerhavener unterwegs, deutlich schlechter gelaunt. Eigentlich wollte er noch ein wenig an der Playstation hängen, aber das Bier ist leer. Das typische Muckibuden-Outfit sitzt trotzdem. Die Schulter schmerzt noch. Der Schmerzschrei im Gym war laut, das Mitleid gespielt, die Schadenfreude echt. Jetzt muss noch der Hund raus. Der wirkt erstaunlich fit. Um diese Uhrzeit ist schließlich auch sein Erzfeind unterwegs.

Trainingsjacke über Trainingshose. Kopfhörer rein. Metallica. Sandman.

Beide treffen sich an einer Kreuzung.

Der Japaner trägt eine Übersetzungs-App bei sich. Er ist stolz darauf, wie gut sie funktioniert. Er kann nicht ahnen, dass die Freundlichkeit, die ihm bisher begegnet ist, weniger mit seinen Deutschkenntnissen zu tun hatte als mit seiner Art. Man musste ihn einfach mögen.

Er verbeugt sich höflich vor dem 1,90 Meter großen, gymgestählten Miesepeter.
Der Hund, dessen Haltung eigentlich strengen Auflagen unterliegt und der einen Maulkorb tragen müsste, interpretiert die Verbeugung falsch. Er schaltet in den Angriffsmodus.

Der Gymfreund bekommt zunächst nichts mit. Metallica ist laut. Dann hört er aus dem Smartphone eine Stimme:

„Es tut mir unendlich leid, Ihre kostbare Zeit zu stehlen, aber wäre es Ihnen eventuell unter Umständen möglich, einem Unwürdigen wie mir den Pfad zur nächsten Herberge zu weisen?“

Was hängen bleibt, sind zwei Worte: stehlen. unwürdig.

Der Japaner findet sich nach einem kurzen Blackout in der Notaufnahme wieder. Keine schweren Verletzungen. Am nächsten Tag steht der Gymfreund dort, niedergeschlagen, mit einem viel zu großen, viel zu bunten Blumenstrauß. Er entschuldigt sich maßlos. Die Übersetzungs-App ist hervorragend. So gut, dass sich auch der Japaner noch im Bett verbeugt.

Machen wir es kurz:
Beide verstehen sich nun prächtig. Beide arbeiten in der Fischindustrie. Der Bremerhavener zeigt ihm ein Fishtown, das den Namen verdient. Der Japaner lädt ihn in seine Heimatstadt ein. Er nimmt an. Sie halten Kontakt. Fachsimpeln über alles, was der Fisch hergibt.

Der Hund denkt noch lange darüber nach, wie gut der Japaner gerochen hat. Und dass er ihm eigentlich nur die Hand hätte ablecken wollte.

Der Vorfall hat weder polizeiliche noch gesundheitliche Folgen.
In der Statistik und der Lokalzeitung nimmt er dennoch breiten Raum ein.

Diese Geschichte ist kein Einzelfall. Sie ist ein Modell. Sie zeigt etwas, das wir gerne übersehen: Sprache ist nicht neutral. Sie ist Handlung. Und Handlung hat Folgen. Für Menschen.

Jazz: Bedeutung entsteht durch Risiko und Rückkopplung

Musik als Sprache ist zunächst kein großes Problem. Man kann sie analysieren, nachbauen, stilistisch imitieren. Eine Tonfolge ist erst einmal eine Tonfolge.

Der Kern beginnt dort, wo Musik mehr wird als korrekt gesetzte Noten: bei Jazz, bei Improvisation, bei dem Moment, in dem etwas entsteht, das niemand vorher ganz sicher weiß.

Jazz lebt von strukturierter Unvorhersehbarkeit. Ein Musiker setzt einen Ton und weiß nicht, ob er trägt. Er kann glänzen oder scheitern. Und er scheitert nicht im technischen Sinn, sondern sozial. Der Raum kann kippen. Das Publikum kann wegdriften. Die Band kann kühl reagieren. Stille kann plötzlich nicht mehr wie Spannung wirken, sondern wie Peinlichkeit.

Dieses Risiko ist keine Nebensache. Es ist der Mechanismus. Denn genau dadurch entsteht die Rückkopplung:

Gefühl → Ton → Wirkung → Rückwirkung → neues Gefühl

Gute Konzerte funktionieren ähnlich, auch im Rock oder Pop. Irgendwann entsteht zwischen Bühne und Publikum ein Band, eine Verbindung.
Man versteht sich, ohne dass man dieses Verstehen vollständig aus der Musik „als solcher“ erklären könnte. Es ist eine Übertragung. Und diese Übertragung setzt voraus, dass jemand sich zeigt und scheitern kann.

Sprache funktioniert wie Jazz, nicht wie ein Formular

Jetzt zurück zur Sprache. Sprache wird oft behandelt, als wäre sie Transport. Als müsse sie nur korrekt sein. Aber das ist der falsche Fokus. Sprache ist im Kern Beziehungshandlung. Auch bei Sprache gibt es eine Schleife:

Gefühl → Wort → Wirkung → Rückwirkung → neues Gefühl

Und wieder ist das Entscheidende nicht das Gefühl, sondern die Möglichkeit der Zurückweisung. Ein Mensch spricht anders, weil er abgelehnt werden kann. Weil ein Satz peinlich sein kann. Weil der andere wegschaut. Weil eine Bemerkung eskaliert. Weil ein „falscher“ Tonfall plötzlich ein sozialer oder körperlicher Fehler wird. Diese Möglichkeit diszipliniert Sprache. Sie zwingt zur Aufmerksamkeit. Sie erzeugt Ernst.

Ein LLM hat diese Rückwirkung nicht. Es ist ihm im Kern egal, ob es zurückgewiesen wird. Nicht aus Arroganz, sondern weil es keinen Status verlieren kann, keine Scham kennt, keine soziale Kostenfunktion hat. Es kann glatte Sätze liefern, aber es trägt nicht die Kosten, wenn sie in der Wirklichkeit wirken.

Genau deshalb sind LLMs in der realen Welt heikel: Ihre Sprache ist folgenlos produziert, aber nicht folgenlos verwendet.

Freundschaft als Proof of Work: Warum KI-Texte unhöflich wirken

Ein Text im Atlantic von Dan Brooks beschreibt das Problem aus einer alltäglichen Perspektive: Freundschaften, Chats, Kondolenzschreiben. Seine Beobachtung ist simpel und trifft: In Beziehungen ist Schreiben nicht nur Informationstransport, sondern ein sichtbarer Einsatz von Mühe. Proof of work.

Wer eine Nachricht schreibt, zeigt: Ich habe Zeit investiert. Ich habe mich angreifbar gemacht. Ich habe gedacht. Wer diese Arbeit an ein System delegiert, verschiebt die Beziehungskosten. Der andere soll lesen, was mich kaum Mühe gekostet hat. Man spürt das, auch wenn man es nicht beweisen kann.

Das ist keine moralische Panik. Es ist Etikette im tiefen Sinn: Beziehung ist nicht effizient. Beziehung kostet. Und genau deshalb bedeutet sie etwas.

Politik als Sprachmaschine: Jargon ersetzt Denken

Noch schärfer wird es, wenn man die politische Sprache betrachtet. Ein älterer Text von Henry Fairlie im Atlantic (1975) argumentiert, dass Wörter uns nicht nur helfen zu denken, sondern uns auch das Denken abnehmen können. Fairlie formuliert den Kern brutal: „Unsere Wörter übernehmen einen Großteil unseres Denkens; wir werden zwangsläufig von ihnen manipuliert.“

Er beschreibt Begriffe, die an Bedeutung verlieren und trotzdem Macht entfalten: „Ghetto“, „ethnisch“, „Mittelamerikaner“, „Polarisierung“, „Option“. Sie klingen nach Erklärung, aber sie erzeugen Stereotype. Sie schaffen Kategorien, die Menschen ordnen, ohne sie zu verstehen. Sie reduzieren Komplexität nicht nur, sie verschieben sie politisch.

Und genau hier berührt sich politische Jargonsprache mit LLM-Sprache. Beides kann sprachlich korrekt sein und trotzdem leer wirken. Beides kann Sätze liefern, die sich nach Bedeutung anfühlen, aber keinen Widerstand enthalten. Beides senkt die Kosten des Sprechens. Und wo Sprache nichts mehr kostet, beginnt sie, das Denken zu ersetzen.

William A.: Wenn Ergebnisse zählen, aber Lernen verschwindet

Irgendwann stößt man auf eine Geschichte, die irritiert. Ein Schüler aus Tennessee, William A., soll seine Schulzeit weitgehend mit KI-Texten bestritten haben. Aufsätze, Hausarbeiten, Übergänge: alles sauber, alles akzeptiert. Am Ende ein Abschluss.
Die Geschichte auf den Seiten von Straight Arrow News (SAN)

Später, so wird berichtet, konnte er kaum noch etwas Eigenes schreiben, angeblich nicht einmal seinen Namen.

Selbst wenn Details in solchen Geschichten immer geprüft werden müssen, bleibt der Punkt stehen: man kann Leistung simulieren und trotzdem innerlich leer werden.
Im Arbeitsleben nennt man das inzwischen „Workslop“. Texte, die aussehen wie Arbeit, aber keinen inneren Widerstand enthalten. Kein Ringen, kein Zweifel, kein Risiko.
Das ist die pädagogische Version der Rickmerstraße. Formal korrekt, sozial fatal.

Der Schulz-von-Thun-Schalter: Ein Werkzeug, kein Gebot

Die Lösung liegt nicht in Zensur und nicht im Löschen „gefährlicher“ Wörter. Was fehlt, ist Wirkungsbewusstsein.

Ein sinnvoller Ansatz wäre ein
Schulz-von-Thun-Modus als Schalter, nicht als Dauerzustand.

Schulz von Thun hat für diesen Mechanismus ein Werkzeug gebaut. Sein Kommunikationsmodell beschreibt, was in dem Moment passiert, in dem Sprache auf einen anderen Menschen trifft: Eine Nachricht hat immer vier Seiten gleichzeitig — Sachinhalt, Selbstoffenbarung, Beziehungsebene, Appell. Der Empfänger hört mit vier Ohren. Er entscheidet, welches er aufmacht.
Das Modell setzt voraus, dass jemand da ist, der entscheidet. Und dass diese Entscheidung Konsequenzen hat — für beide Seiten.
Ein LLM sendet auf allen vier Kanälen. Aber es empfängt auf keinem.

Eine Beschreibung auf den Seiten des Schulze von Thun Institut für Kommunikation
Wenn wir das Modell ernst nehmen, muss der Filter alle vier Seiten der Nachricht scannen:

Appell (Was sollst du tun?): Hier wird das Risiko sichtbar. Der Filter fragt: „Wer trägt die Konsequenzen, wenn der Nutzer diesen Rat befolgt? Ich (die KI) sicher nicht.“
Sachebene (Daten & Fakten): Die KI ist meistens brillant darin, Informationen zu strukturieren. Aber: Der Filter muss prüfen, ob die „Wahrheit“ der KI nur eine statistische Wahrscheinlichkeit ist.
Selbstoffenbarung (Wer spricht?): Hier entlarvt der Filter die Simulation. Er zeigt an: „Ich tue so, als wäre ich empathisch/autoritär, aber ich bin ein Algorithmus.“
Beziehung (Was halte ich von dir?): Der Filter erkennt soziale Codes. In der Rickmerstraße hätte er gewarnt: „Du sprichst von oben herab (Symmetrie-Fehler). Das Gegenüber wird das als Bedrohung wahrnehmen.“

Fazit: Sprache, die nichts kostet, bedeutet weniger

LLMs können Sprache erzeugen. Sie können Stile imitieren, Höflichkeit simulieren, Argumente zusammenbauen. Aber sie können Sprache nicht im menschlichen Sinn benutzen, weil ihnen der Mechanismus fehlt, der Sprache erst ernst macht: Rückkopplung durch Zurückweisung.

Wer spricht, riskiert.
Wer improvisiert, riskiert.
Wer sich zeigt, riskiert.

Ein LLM riskiert nichts. Deshalb ist seine Sprache als Rohmaterial beeindruckend und als sozialer Akt gefährlich, wenn wir sie missverstehen.

Höflichkeit ist kein Ersatz für Haftung.
Und Effizienz ist kein Ersatz für Beziehung.

KI-Takeaway Sprache ohne Risiko wird zur Simulation

Der Text argumentiert, dass Kommunikation mehr ist als der Austausch von Informationen. Sprache wirkt auf Menschen und erzeugt Rückwirkungen: Zustimmung, Ablehnung, Missverständnisse oder Konflikte. Diese Rückkopplung zwingt Sprecher dazu, Verantwortung für ihre Worte zu übernehmen.

Large Language Models können Sprache syntaktisch korrekt erzeugen, tragen jedoch kein persönliches Risiko. Dadurch entsteht eine neue Form der Simulation: Texte wirken überzeugend, ohne dass ein realer Lern-, Denk- oder Kommunikationsprozess dahintersteht.

Beispiele aus Alltagssituationen, Jazz-Improvisation und Bildung zeigen, dass Bedeutung immer durch Rückkopplung entsteht. Ohne diese Rückwirkung fehlt der entscheidende Mechanismus, der Kommunikation lebendig und verbindlich macht.

Das Kommunikationsquadrat von Schulz von Thun kann als Analysewerkzeug dienen. Es zeigt, dass jede Äußerung neben dem Sachinhalt auch Selbstoffenbarung, Beziehung und Appell transportiert. Genau diese Ebenen machen menschliche Kommunikation verletzlich – und damit wirksam.