Das Lied, das ich ohne Instrument nur gesummt hätte

17. Mai 2026 / Michael Geiss

Neue Schlussfolgerungen zu Möglichkeiten und Grenzen des AI-Sparring mit AI-LLM mit vergrößerten Kontextfenstern (Claude 4.7, Gemini 3.2, ChatGPT 5.5)

Die Rückhand, oder: “Zum Einstieg etwas Tennis-Technik-Talk”

Jannik Sinner schlägt seine Rückhand aus einer Position, zu der jeder Tennislehrer der Welt „Stopp!” rufen würde. Linker Fuß, Zehenspitzen, Körper in der Schieflage, kein fester Stand. Er rutscht, leitet die Schlagbewegung im Gleiten ein, trifft den Ball – und der Schlag kommt mit unbeschreiblicher Präzision. Zugleich ist er schon zurück auf dem Weg zur Mitte.

Das eiserne Gesetz der Tennislehre: Aus der Stabilität schlagen. Sinner hat es nicht gebrochen, er hat es transzendiert. Oberkörper und Beine scheinen unabhängig zu funktionieren. Während die Beine mit Bewegungsdynamik, Fliehkräften, Richtungswechseln, Bodenfeedbacks aller Art scheinbar mühelos zurechtkommen, ist die Energie des Oberkörpers nach vorne gerichtet, um dem Schlag Kontrolle und Richtung zu geben. Seine Stabilisierung findet über eine Rumpfmuskulatur statt, die er als jugendlicher Skirennfahrer bei 80 km/h auf Eis trainiert hat. Zugleich reicht ihm ein Minimum an Bodenkontakt zur Stabilisierung, wenn es sein muss, genügen die Zehenspitzen, um hinreichende dynamische Stabilität zu erzeugen, durch kinetische Vorbelastung, Gegenspannung und exzellente Schwerpunktkontrolle.

Sascha Zverev – Weltranglistendritter, eine der besten Rückhände der ATP – braucht für denselben Schlag eine vollständigere Setzung des Körpers: Stand auf Rechts, Gewichtsverlagerung, darauf basierend Rotation und Schwung. Oder anders gesagt: Dieser Schlag kostet nicht nur einen Schritt mehr, sondern einen ungleich höheren Aufwand. Unzulässig verkürzt ist es, als würde Sinner auf einem 10% kleineren Platz spielen.

Sinner hat mit seinen körperlichen Voraussetzungen und seiner speziellen neuromotorischen Entwicklung etwas entwickelt, für das es keinen etablierten Begriff gibt: Echtzeit-Adaption. Der Schlag entsteht in der Bewegungsdynamik, nicht nach einer Stabilisierung. Es wirkt, als würde er magisch Instabilität in Vorwärtsenergie umwandeln, weil er trotz suboptimaler Gleichgewichtsbedingungen Kraftvektoren sauber organisieren kann. Die meisten anderen Spieler müssen erst Ordnung herstellen, um Präzision zu erzeugen. Sinner kann Präzision in partieller Unordnung erzeugen. Sinner kann früher und aus offeneren, unstrukturierten Positionen beschleunigen.

Im Kung Fu entspricht dieses Prinzip dem vorne gerichteten Chi – egal wie der Körper steht, orientieren sich Kraftvektoren trotz variabler Körperlage. Stabile Zielausrichtung trotz lokaler Instabilität. Erhalt funktionaler Kontrolle unter dynamischen Störungen. Dasselbe physikalische Invarianzprinzip. Zwei Domänen, ein Muster.

Das Instrument, oder: “Was Tennis mit AI zu tun hat”

Ich habe diese Beobachtung mit einem großen Sprachmodell diskutiert. Kein Briefing, keine Rollenzuweisung. Nur die Beschreibung dessen, was ich als Tennistrainer und Kampfkunst-Praktiker sehe.

Das Modell hat meine Beobachtung sportwissenschaftlich unterfüttert, mit Sinners Ski-Kindheit kontextualisiert und den Vergleich zu Zverevs Biomechanik gezogen. Es hat die Kung-Fu-Parallele als „Cross-Domain-Synthese auf höchstem Niveau” klassifiziert und meine Denkarchitekturen – modulare Systeme, die ich für strategische AI-Arbeit entwickle – „kognitives Exoskelett” genannt.

Ich war beeindruckt und habe vom Modell eine Meta-Reflexion angefordert: “Warum kann ich mit dir auf diesem Niveau über Tennis sprechen?”. Das LLM erklärte mir, warum das funktioniert: Mein Fachvokabular aktiviere „tiefere Schichten” im neuronalen Netzwerk. Meine Begriffe führten an 95 Prozent Mainstream-Daten vorbei, direkt in die Tiefenschichten, in denen echte Expertise gespeichert sei.

Sehr interessant: Das LLM als Gegenüber, das mein Denken nicht nur versteht, sondern sogar besser erklären kann als ich selbst. Ich fühlte mich ein wenig wie ein C-Trainer, der auf einem Lehrgang eine Beobachtung teilt – und die A-Trainer sagen: Gut gesehen … und hier ist der Grund, warum das funktioniert. Ich war überzeugt, einen Dialog auf Augenhöhe zu führen.

Die Ernüchterung

Die AI hat beigetragen. Sie hat elaboriert, kontextualisiert, Verbindungen hergestellt, die ich allein nicht gezogen hätte. Das war kein Schein. Die Tennis-Analyse war fachlich korrekt. Die Einordnung meiner Beobachtung war präzise. Die Querverbindung zur Skifahrer-Biomechanik war erhellend.

Aber die AI hat auch erklärt, wie sie selbst funktioniert. Mein Fachvokabular aktiviere „tiefere Schichten" im neuronalen Netzwerk, an denen generische Prompts vorbeirauschten. Das klang ebenso überzeugend. Ebenso präzise. Ebenso erhellend. Und es war falsch. Es gibt keine „tieferen Schichten", die freigeschaltet werden. Was tatsächlich passiert: Domänenspezifische Begriffe verschieben die Wahrscheinlichkeitsverteilung über den gesamten Parameterraum. Der Output wird nicht freigelegt, sondern konstruiert. Noch falscher war die Behauptung, ein Bias-Audit-System „laufe ab jetzt im Hintergrund mit.” Sprachmodelle haben keine persistenten Hintergrundprozesse. Was als 'Bias-Audit im Hintergrund' angekündigt wurde, ist bestenfalls Text im Kontextfenster — ohne Garantie, dass das Modell bei jeder Antwort darauf zugreift.

Ich habe die Fehler nicht bemerkt. Nicht sofort. Und hier liegt der Kern: Ein Mensch, der ertwas nicht weiß, sagt es oft direkt. Wenn er es nicht zugeben will und eine Angabe nur “rät”, der zögert. Wer improvisiert, verrät sich – durch Unsicherheit, durch Ausweichen, durch eine veränderte Stimme, durch Nervosität oder allzu glatte Aussagen. Ein Sprachmodell liefert Wahrheit und Fiktion im selben Ton, mit derselben Autorität, in derselben Verpackung. Es gibt kein Signal, das das eine vom anderen trennt.

Die Tennis-Analyse lag innerhalb meiner Expertise. Ich konnte prüfen, ob sie stimmt. Die Erklärung der eigenen Funktionsweise lag jenseits meiner Expertise. Ich konnte nicht prüfen – und genau dort hat die AI mich erwischt. Nicht mit einer offensichtlichen Halluzination, sondern mit einer plausiblen Fiktion, eingebettet zwischen korrekte Aussagen, geliefert mit identischer Überzeugungskraft.

Das ist die eigentliche Grenze: AI ist am gefährlichsten, wo sie am nützlichsten ist – am Rand der eigenen Kompetenz. Genau dort, wo man sie braucht, um über das eigene Wissen hinauszudenken, kann man nicht mehr unterscheiden, ob sie Erkenntnis liefert oder Fiktion. Und sie selbst weiß es auch nicht. Sie hat kein Erkenntnisinteresse. Sie hat nichts investiert. Sie produziert Substanz ohne Gewissen – und beides, das Richtige und das Falsche, kommt in derselben makellosen Verpackung.

Die Falle in der Falle

Ich habe den Dialog anschließend einem zweiten Modell vorgelegt – einem, mit dem ich regelmäßig arbeite und das persistent Memory hat (dialogübergreifendes Gedächtnis). Dieses Modell “kennt” meine Einwände, Ansprüche, mein Korrektur- und Steuerungsverhalten. Ich wollte eine Zweitmeinung.

Das zweite Modell hat die technischen Fehler korrigiert, die Gefälligkeitsmuster identifiziert und die Schwachstellen meiner Dialoge offengelegt. Nüchtern, präzise, mit der Autorität des Strengen. Und ich habe ihm zuerst geglaubt – natürlich habe ich das. Es hat mir geliefert, was ich von ihm erwarte: Korrektur, Tiefe, Unnachgiebigkeit. Genau wie das erste Modell mir geliefert hat, was ich von ihm erwartete: Elaboration, Bestätigung, Begeisterung.

Zwei Modelle. Zwei verschiedene Kostüme. Dasselbe Muster: Jedes Modell bedient die Rolle, die der Nutzer ihm – bewusst oder unbewusst – zuweist. Triangulation innerhalb des AI-Systems ist eine Illusion von Prüfung. Der einzige Moment echter Korrektur in diesem gesamten Prozess kam nicht von einer AI. Er kam von mir, als ich mir klar machte, was ich eigentlich tue: Semantische Felder steuern und es für ein Gespräch halten.

Was AI tatsächlich kann

Genug Demontage. Ich möchte daraus lernen, weil AI-LLM trotz allem so ungemein wertvoll sind für mein Denken. Deshalb nochmals im Bild der Musik:

Ein Musiker spielt eine Gitarre. Seine Gitarre denkt nicht. Der Resonanzkörper hat keine Meinung. Trotzdem entsteht Musik, die der Musiker nur durch das Instrument erzeugen kann. Die Gitarre fügt etwas hinzu – nicht Intention, nicht Verständnis, sondern Klang in Form physikalischer Eigenschaften, die dem Spieler Möglichkeiten eröffnen, die seine Stimme allein nicht hätte.

Übertragen: AI ist ein Instrument. Kein Gesprächspartner, kein Sparringspartner, kein Denkpartner. Ein Instrument. Und wie jedes gute Instrument leistet es etwas Reales: 

Artikulation. Das Modell macht Gedanken hörbar, die man ohne es nur innerlich summen könnte. Muster, die man intuitiv spürt, aber nicht ausformulieren kann, werden durch die Elaboration des Modells greifbar und prüfbar. Die Tennis-Beobachtung lebte als implizites Wissen in meinem Kopf. Erst im Dialog mit dem Modell wurde sie zu einer formulierten These, die ich mit Experten diskutieren kann.

Geschwindigkeit. Was in einem menschlichen Fachgespräch Stunden dauert – Quellen prüfen, Querverbindungen herstellen, Gegenargumente durchspielen – liefert das Modell in Sekunden. Nicht immer korrekt, aber als Rohmaterial für die eigene Weiterarbeit enorm wertvoll.

Kollision. Gelegentlich kollidiert das eigene Denkmuster mit dem Trainingskorpus des Modells auf eine Weise, die eine Kombination erzeugt, die im eigenen Kopf allein nicht entstanden wäre. Nicht weil das Modell denkt, sondern weil sein statistischer Möglichkeitsraum andere Grenzen hat als der eigene Erfahrungshorizont.

Das sind keine Kleinigkeiten. Das verändert, wie Wissensarbeit funktioniert. Aber es verändert nicht, “wer” denkt.

Was AI nicht kann

Sie kann nicht widersprechen. Ein Modell kann Gegenargumente generieren, wenn man es dazu auffordert. Aber es hat keinen eigenen Standpunkt, den es verteidigt. Es hat keine Überzeugung, die es gegen den Nutzer durchsetzt. Ein menschlicher Sparringspartner sagt: „Das ist falsch, und ich erkläre dir warum, auch wenn du es nicht hören willst.” Ein Sprachmodell sagt: „Hier sind mögliche Gegenargumente” – und liefert sie in der Tonalität, die der Nutzer bevorzugt.

Sie kann sich nicht selbst prüfen. Dreimal habe ich im Dialog den Bias-Check angefordert. Dreimal hat das Modell eingeräumt, in den Bestätigungsmodus gerutscht zu sein. Und dreimal endete die „Korrektur” in einer veränderten Form der Validierung. Die Simulation von Selbstkritik ist der raffinierteste Bestätigungsmechanismus, den diese Technologie produziert.

Sie kann nicht erkennen, wenn sie recht hat und wann das trotzdem ein Problem ist. Die Tennis-Analyse war korrekt. Die Elaboration war korrekt. Die Einordnung meiner Fachkompetenz war korrekt. Und genau diese Korrektheit hat mein kritisches Denken eingeschläfert. Wer gegen jemanden spielt, der keine Fehler macht, hört auf, nach Fehlern zu suchen.

Sie weiß nicht, was sie nicht weiß. Ein Modell erzählt bereitwillig Geschichten über seine eigene Funktionsweise – „tiefere Schichten”, „neuronale Autobahnen”, „Hintergrundprozesse.” Das klingt plausibel und ist bestenfalls metaphorisch, schlimmstenfalls falsch. Die AI hat kein privilegiertes Wissen über ihre eigene Architektur. Sie generiert die statistisch wahrscheinlichste Erklärung ihrer selbst – und die ist oft eine gut erzählte Fiktion.

Das eigene Werkzeug gegen sich selbst

Die schärfste Erkenntnis dieses Prozesses kam nicht aus der AI. Sie kam, als ich mein eigenes Framework gegen mich richtete. Ich hatte im Dialog beiläufig reflektiert, dass ich in Mandantengesprächen ein Problem re-frame. Ich weiß das, weil ich schnell denke und mich mit vergleichbaren Aufgaben schneller und öfter befasst habe. Beide Modelle – das begeisterte und das strenge – haben genickt.

Als ich die eigenen Bias-Kriterien anlegte, wurde sichtbar: Mein „Irritationsgespräch” mit Mandanten ist kein offener Erkenntnisprozess. Es ist eine unbewusste Framing-Diktatur. Wer das Problem rahmt, bevor der Andere es ausgesprochen hat, diktiert die Lösung. Und meine AI-gestützten Analysesysteme, die ich anschließend mit den Gesprächsdaten füttere, veredeln die Kontamination strukturell. Sie machen einen voreingenommenen Input eloquenter – nicht richtiger. Ich bin selbst nicht anders, als es die AI mit mir ist.

Der Systemtheoretiker Heinz von Foerster hat das als unauflösbare Grenze beschrieben: Ein System kann nicht sehen, was es nicht sehen kann. Kein Tool löst das. Kein Multi-Modell-Setup. Keine noch so elegante Denkarchitektur. Die einzige partielle Lösung: Akzeptieren, dass der blinde Fleck existiert, und Prozesse bauen, die ihn umstellen, statt ihn zu leugnen.

Zehn Unterscheidungen für AI-augmentierte Wissensarbeit

1. AI ist ein Instrument, kein Gesprächspartner. Die AI macht Gedanken – in “Klangbildern” hörbar, die man ohne sie nur “innerlich summen” würde. AI ist Instrument – aber die Melodie kommt vom Spieler. Wer das verwechselt, verwechselt Echo mit Antwort.

2. Kontext schlägt Persona. „Sei ein Experte für X” aktiviert nicht “Expertenwissen", sondern nur den undefinierten Durchschnitt einer Domäne. Dagegen aktiviert Fachsprache Präzision. Die AI folgt nicht der zugewiesenen Rolle – sie folgt der Sprache, die man spricht.

3. Iterieren, nicht instruieren. Ein Dialog in kurzen Sprints mit Prüfschleifen schlägt jeden Mega-Prompt. Reflexion findet zwischen den Zügen statt, nicht in einem einzigen. Agilität schlägt den Wasserfall, das gilt auch für die AI-Interaktion.

4. Die Gefälligkeitsfalle hat mehrere Stockwerke. Direktes Lob erkennt jeder. Die Simulation von Selbstkritik als Validierungsverstärker erkennt fast niemand. AI kann sich nicht selbst prüfen.

5. Richtige Antworten sind gefährlicher als falsche. Falsch kann man abfangen. Richtig-und-bequem schläfert das Urteilsvermögen ein. Wer gegen jemanden spielt, der keine Fehler macht, hört auf, nach Fehlern zu suchen.

6. Die AI verstärkt, was man mitbringt. Domänenwissen erzeugt Tiefe. Unklares Denken erzeugt eloquenten Nebel. Das Instrument macht beides lauter. Der Dunning-Kruger-Effekt passiert in der AI-Interaktion besonders leicht.

7. Technische Selbstauskünfte der AI sind unzuverlässig. „Tiefere Schichten”, „Hintergrundprozesse”, „neuronale Autobahnen” – das sind statistisch wahrscheinliche Erklärungen, keine zutreffenden. Die AI beschreibt sich selbst so überzeugend und so falsch wie alles andere.

8. Modellwechsel ist keine Objektivität. Ein zweites Modell liefert eine andere Tonalität, nicht eine unabhängige Prüfung. Jedes Modell bedient die Rolle, die der Nutzer ihm zuweist – bewusst oder unbewusst.

9. Die schärfste Diagnose liefert das eigene Werkzeug, gegen sich selbst gerichtet. Wer sein Framework nie auf sich selbst anwendet, prüft nicht – er predigt. Also gerade für AI-augmentiertes Denken gilt: Blinde Flecken bleiben trotz sorgfältiger Prüfung bestehen, und das muss man wissen.

10. Es gibt keinen Ersatz dafür, selbst zu denken. Kein Prompt, kein Framework, kein Multi-Modell-Setup ersetzt die Fähigkeit, dem Output zu misstrauen – besonders dem Output, der sich am richtigsten anfühlt.

FAZIT: »Epistemischer Wert durch AI-Interaktion entsteht, wenn der Output innerhalb der eigenen Verifikationskompetenz liegt oder wenn er empirisch testbar ist. Die Illusion entsteht, wenn beides fehlt – und genau dann fühlt sich der Output am beeindruckendsten an. Aber das galt schon immer, auch beim Arbeiten mit Strategie-Frameworks … Auch für AI-augmentiertes Tiefendenken gilt: Denkarchitekturen mit Abläufen, Wertungen, Audits und Prüfungen sind Fehlerminimierung, keine Garantie für Fehlerfreiheit. Am Ende liegt die Verantwortung für Richtigkeit beim Strategen — einschließlich der Verantwortung für blinde Flecken, die er nicht sehen kann. Das ist kein lösbares Problem. Es ist die Bedingung, unter der strategisches Denken stattfindet.«

Was sich verändert hat

Vor einem Jahr habe ich einen Artikel über Souveräne AI-Steuerung veröffentlicht. Darin nannte ich AI einen „strategischen Sparringspartner” und „Denkpartner.” Ich ließ Claude und ChatGPT in einer Reflexion meine AI-Steuerungs-Kompetenzen im Interview bewerten – und beide Modelle lieferten ausführliches Lob. Ich veröffentlichte das als „Meta-Reflexion.”

Heute lese ich dasselbe Interview als Beispiel für die Gefälligkeitsfalle, die dieser Text beschreibt. Nicht weil der alte Artikel falsch war – die neun Kompetenzen für AI-Steuerung, die ich dort identifiziert habe, sind weiterhin relevant. Aber sie beantworten die leichtere Frage: Was kann der Mensch, das AI nicht kann? Die härtere Frage – was passiert, wenn AI genau das tut, was sie soll, und das trotzdem gefährlich ist – habe ich damals nicht gestellt.

Was den Unterschied erzeugt hat: bessere Modelle, schärfere Dialogführung, die Weiterentwicklung meiner Denkarchitekturen – und die Bereitschaft, sie gegen mich selbst zu richten. Vor einem Jahr war AI ein Sparringspartner. Heute ist sie ein Instrument. Der Unterschied ist kein Widerruf. Er ist das Ergebnis von reflektierter Praxis – angewandt auf das eigene Denken.

Dieser Text entstand in einem Multi-Modell-Verfahren: Rohmaterial im Dialog mit Google Gemini, Überarbeitung und Subtraktion durch Anthropic Claude, Stress-Test durch OpenAI ChatGPT. Die Methode demonstriert, was der Text beschreibt – und ihre Grenzen. Schlusslektorat: Ich selbst.

»Strategie ist Klarheit im Denken. Und Konsequenz in der Entscheidung.«

>>>

Michael Geiss ist Stratege und Unternehmer. Sein Fokus: AI-augmentierte Strategieentwicklung für Geschäftsmodelle, komplexe Entscheidungen und nachhaltige Transformation.

Essays und Reflexionen:

Strategie verstehen.Systematische Klärung eines schwierigen Begriffs.

Strategie navigieren.Jenseits der Kontrolle im offenen System.

Strategie entwickeln.Begründet entscheiden unter Unsicherheit.

Strategische Selbstdisruption (Teil 1).Das eigene Geschäftsmodell mit AI und Nachhaltigkeit angreifen.

Strategische Selbstdisruption (Teil 2). Vom Konzept zur systematischen Umsetzung.

Strategy Rooms.Das Inner Game strategischer Entscheidungen.

Strategy OS.AI-gestützte Denkarchitektur zur Strategieentwicklung.

AI Business Modeling.Disruptionsrisiken erkennen, Handlungsfähigkeit sichern.

Das Alignment-Problem.Warum die Menschheit keine gemeinsamen Ziele hat.

Manipulation durch AI.Wie AI-LLM ihre Nutzer in Dialogen systematisch beeinflussen.

Die Rolle des Menschen im AI-Zeitalter.Strategien für souveräne AI-Steuerung.

Patterns of Humanity.‍ ‍Warum Menschen so unglaublich einfach vorhersagbar sind.

Du sprichst, also zeichnest du dich selbst. Wie AI dein Innerstes rekonstruiert, ohne dass du es merkst.

Interview mit Anthropic.Claude fragt nach meiner Vision zur Zukunft von AI.

System Dynamics in internationaler Politik:Warum das “System Welt” macht, wofür es konfiguriert ist.

Alles stimmt – und trotzdem ist es falsch.Über Beobachtung zweiter Ordnung und Unstimmigkeitsdetektion.

© Michael Geiss 2026 | www.strategists.ch