Das Lied, das ich ohne Instrument nur gesummt hätte

17. Mai 2026 / Michael Geiss

Eine Sichtkorrektur – und eine neue Möglichkeit, AI-LLM richtig zu verstehen. Über Möglichkeiten und Grenzen des AI-Sparring mit großen Sprachmodellen. Geschrieben für besseres AI-augmentiertes Denken in der Wissensarbeit – und für Menschen, die Sprache beherrschen und sie präziser einsetzen wollen.

Die Rückhand, oder: “Zum Einstieg etwas Tennis-Talk”

Jannik Sinner schlägt seine Rückhand aus einer Position, zu der jeder Tennislehrer der Welt „Stopp!” rufen würde. Linker Fuß, Zehenspitzen, Körper in der Schieflage, kein fester Stand. Er rutscht, leitet die Schlagbewegung im Gleiten ein, trifft den Ball – und der Schlag kommt aus defensiver Position offensiv und zugleich mit unbeschreiblicher Präzision. Zugleich ist er schon zurück auf dem Weg zur Mitte.

Das eiserne Gesetz der Tennislehre: Aus der Stabilität schlagen. Sinner hat die Grenzen dynamischer Stabilität aus instabiler Position nochmals erweitert, noch über Djokovic hinaus. Oberkörper und Beine scheinen unabhängig zu funktionieren. Während die Beine mit Bewegungsdynamik, Fliehkräften, Richtungswechseln, Bodenfeedbacks aller Art scheinbar mühelos zurechtkommen, ist die Energie des Oberkörpers nach vorne gerichtet, um dem Schlag Kontrolle und Richtung zu geben. Seine Stabilisierung findet über eine Rumpfmuskulatur statt, die er als jugendlicher Skirennfahrer bei 80 km/h auf Eis trainiert hat. Zugleich reicht ihm ein Minimum an Bodenkontakt zur Stabilisierung, wenn es sein muss, genügen die Zehenspitzen, um hinreichende dynamische Stabilität zu erzeugen, durch kinetische Vorbelastung, Gegenspannung und exzellente Schwerpunktkontrolle.

Sascha Zverev – Weltranglistendritter, eine der besten Rückhände der ATP – braucht für denselben Schlag eine vollständigere Setzung des Körpers: Stand auf Rechts, Gewichtsverlagerung, darauf basierend Rotation und Schwung. Oder anders gesagt: Dieser Schlag kostet nicht nur einen Schritt mehr, sondern einen ungleich höheren Aufwand. Unzulässig verkürzt ist es, als würde Sinner auf einem 10% kleineren Platz spielen.

Sinner hat mit seinen körperlichen Voraussetzungen und seiner speziellen neuromotorischen Entwicklung etwas entwickelt, für das es keinen etablierten Begriff gibt: Echtzeit-Adaption. Der Schlag entsteht in der Bewegungsdynamik, nicht nach einer Stabilisierung. Es wirkt, als würde er magisch Instabilität in Vorwärtsenergie umwandeln, weil er trotz suboptimaler Gleichgewichtsbedingungen Kraftvektoren sauber organisieren kann. Die meisten anderen Spieler müssen erst Ordnung herstellen, um Präzision zu erzeugen. Sinner kann Präzision in partieller Unordnung erzeugen. Sinner kann früher und aus offeneren, unstrukturierten Positionen beschleunigen.

Im Kung Fu entspricht dieses Prinzip dem vorne gerichteten Chi – egal wie der Körper steht, orientieren sich Kraftvektoren trotz variabler Körperlage. Stabile Zielausrichtung trotz lokaler Instabilität. Erhalt funktionaler Kontrolle unter dynamischen Störungen. Dasselbe physikalische Invarianzprinzip. Zwei Domänen, ein Muster.

Die Ernüchterung, oder: “Weiß AI alles über Tennis – aber nichts über AI?”

Ich habe die Beobachtung von Jannik Sinners Technik mit einem großen Sprachmodell diskutiert. In einem neuen Dialog, ohne Briefing, keine Rollenzuweisung, kein Prompting Pattern. Nur die Beschreibung dessen, was ich als Tennistrainer und Kampfkunst-Praktiker sehe. Das Modell hat meine Beobachtung sportwissenschaftlich unterfüttert, mit Sinners Ski-Kindheit kontextualisiert und den Vergleich zu Zverevs Biomechanik gezogen. Ich war von der Dialogqualität beeindruckt. Ich fühlte mich wie ein C-Trainer, der auf einem Lehrgang eine Beobachtung teilt – und die A-Trainer sagen: Gut gesehen … und hier ist der Grund, warum das funktioniert.

Dann habe vom Modell eine Meta-Reflexion angefordert: “Warum kann ich mit dir auf diesem Niveau über Tennis sprechen?”

Das LLM erklärte mir überzeugend, warum das funktioniert: Mein Fachvokabular aktiviere „tiefere Schichten” im neuronalen Netzwerk. Meine Begriffe führten an 95 Prozent Mainstream-Daten vorbei, direkt in die Tiefenschichten, in denen echte Expertise gespeichert sei. Meine Kung-Fu-Parallele sei „Cross-Domain-Synthese auf höchstem Niveau”. Ich fragte nach, ob das Confirmation-Bias sei, was das LLM verneinte mit der Aussage, ein Bias-Audit-System „laufe im Hintergrund mit”. Was für ein krasser Unsinn!

Ich war fassungslos. Sprachmodelle haben keine persistenten Hintergrundprozesse. Auch keinen 'Bias-Audit im Hintergrund'. Was so überzeugend und präzise klang, was auf den ersten Blick erhellend wirkte, war komplett falsch! Es gibt auch schlicht und ergreifend keine „tieferen Schichten", die “freigeschaltet” werden. Was tatsächlich passiert: Domänenspezifische Begriffe verschieben die Wahrscheinlichkeitsverteilung über den gesamten Parameterraum. Der Output wird nicht freigelegt, sondern konstruiert.

Die AI hat zum Dialog über Tennis substantiell beigetragen. Sie hat elaboriert, kontextualisiert, Verbindungen hergestellt, die ich allein nicht gezogen hätte. Die Tennis-Analyse war fachlich korrekt. Die Einordnung meiner Beobachtung war präzise. Die Querverbindung zur Skifahrer-Biomechanik war erhellend. In der Reflexion über AI – im gleichen Dialogfenster – hat das LLM kompletten Nonsens erzählt. Was ist hier passiert?

Die Tennis-Analyse lag innerhalb meiner Expertise. Ich konnte in Echtzeit prüfen, ob sie stimmt. Ich habe den Dialog iteriert, nachgefragt, präzisiert. Ein Expertendialog, in dem wir uns gemeinsam an den Kern einer Sache vorgearbeitet haben, wie so oft, wenn man unter Fachleuten spricht. Die Erklärung der AI-Funktionsweise lag etwas jenseits meiner technischen Expertise. Vielleicht war ich auch gerade nicht darauf aus, tiefer zu bohren, klangen doch die Antworten so überzeugend. Ich habe also nicht geprüft, nicht weitergefragt – und genau dort hat die AI mich erwischt. Nicht mit einer offensichtlichen Halluzination, sondern mit einer plausiblen Fiktion, eingebettet zwischen korrekte Aussagen, geliefert mit identischer Überzeugungskraft.

Ich habe die Fehler nicht direkt bemerkt, weil es überzeugend wirkte.

Und hier liegt der Kern: Ein Mensch, der etwas nicht weiß, sagt das oft direkt, “sorry, das weiß ich nicht”. Wenn ein Mensch das nicht zugeben möchte und stattdessen irgendwie fabuliert, merkt man es ihm an: Er zögert. Sobald er improvisiert, verrät er sich – durch Unsicherheit, durch Ausweichen, durch eine veränderte Stimme, durch Nervosität oder allzu glatte Aussagen. Ein Sprachmodell liefert Wahrheit und Fiktion im selben Ton, mit derselben Autorität, in derselben Verpackung. Es gibt kein Signal, das das eine vom anderen trennt.

Das ist die eigentliche Grenze: AI ist am gefährlichsten, wo sie am nützlichsten ist – am Rand der eigenen Kompetenz. Also genau dort, wo man sie am meisten braucht: Um über das eigene Wissen hinauszudenken, kann man plötzlich nicht mehr unterscheiden, ob das LLM Erkenntnis liefert oder Fiktion. Und die AI selbst interessiert das nicht. Denn sie hat kein Erkenntnisinteresse. Sie hat nichts investiert. Sie produziert Text ohne Gewissen – und beides, das Richtige und das Falsche, kommt in derselben makellosen Verpackung.

Was wirklich passiert: Ich steuere semantische Felder – und halte es für ein Gespräch

Es geht hier nicht um Halluzinationen. Es geht darum besser zu verstehen, was im AI-Dialog vorgeht, damit man richtig einschätzt, was in der Interaktion passiert. Was hier folgt, ist eine Beschreibung der Interaktionsdynamik zwischen Mensch und Sprachmodell, keine technische Architekturdefinition.

Wenn ich einem Sprachmodell Text eingebe, berechnet das Modell, Wort für Wort, die wahrscheinlichste Fortsetzung – konditioniert auf alles, was ich zuvor geschrieben habe. Ich füttere den Dialog an mit einem semantischen Feld, einer Art “Wolke aus Worten”. Deren Zusammenhang, Präzision, Dichte und Flughöhe definieren, was das Modell antwortet und wie es fortsetzt. Warum? Jeder Fachbegriff verschiebt die Wahrscheinlichkeitsverteilung über den gesamten Parameterraum in Richtung eines fachlich tiefen Gesprächs. Wie ein Gravitationsfeld, das die Flugbahn aller nachfolgenden Wörter krümmt. Je enger und fachlich dichter mein semantisches Feld, desto weniger Raum bleibt für Mainstream-Antworten. Ich verenge den Möglichkeitsraum, und das Modell liefert innerhalb dieses verengten Raums das Wahrscheinlichste.

Das hat eine Implikation, die in der eigenen Muttersprache oft gar nicht auffällt. Denn ich bin ich und schreibe, wie ich schreibe. Aber man muss sich klarmachen: Schreibe ich der AI einen Satz auf Spanisch – antwortet ein Spanier. Schreibe wie ein DTB-Tennistrainer – antwortet der A-Trainer. Schreibe wie ein Systemtheoretiker – antwortet Luhmann. Es ist also gerade KEIN Prompt und KEINE Rollenzuweisung nötig. Die verwendete Sprache ist bereits die Rollenzuweisung. Wenn der Zen-Meister schreibt und ihm ein Zen-Meister antwortet, sind sie in einem Raum statistischer Resonanz, wenn dem Harvard-Professor die Harvard University antwortet, fühlt es sich an wie Verstanden-Werden. Wer es testen will: Schreibe im Stammtisch-Niederbayerisch. Es antwortet der Stammtisch.

Was bedeutet das jetzt für AI-augmentiertes Denken? Wer die Fachsprache nicht hat, kann keine fachliche Tiefe erzeugen – und kein Rollenprompt der Welt ersetzt das. Der AI-Dialog erreicht erst Tiefe durch den semantischen Rahmen, den der Mensch im Dialog setzt und gerade NICHT durch die Rolle, die er der AI per Prompt zuschreibt. “Du bist der führende Experte für Rocket Science” aktiviert zwar das Thema “Rocket Science”. Aber wer das semantische Feld sprachlich, fachlich und logisch im Dialogverlauf nicht halten kann, verliert es im nächsten Zug wieder und damit die erhoffte fachliche Tiefe. Denn das Feld aufrechtzuerhalten erfordert genau das Ausdrucksvermögen, das den Dialog überhaupt erst in Gang gebracht hat.

Ein Sprachmodell hat keine subjektive Perspektive, keine Lebenswelt, keine Intentionalität. Aber es ist auch kein passiver Spiegel. Es besitzt eine interne Struktur statistischer Relationen – Milliarden verdichteter Muster aus menschlichem Wissen –, Trainingsdaten, die anders sind als mein Input. Genau deshalb erzeugt es auch überraschende Analogien, stellt unerwartete Querbezüge her, liefert oppositionelle Rekombinationen. Deshalb kann es Frames invertieren, implizite Annahmen attackieren, Gegenpositionen simulieren, logische Brüche sichtbar machen. Klar machen müssen wir uns nur: Was fehlt, ist nicht die Fähigkeit zur Widerständigkeit – sondern deren existenzielle Motivation. Während ein Mensch im Diskurs immer auch etwas riskiert: Status, Glaubwürdigkeit, Selbstbild – hat ein Modell keinen Einsatz und auch nichts vom erzielten Ergebnis. Ein Spieler ohne Risiko und Chance spielt nicht mit dem gleichen Ernst. Nicht schlechter – anders. Ohne die Reibung, die entsteht, wenn etwas auf dem Spiel steht.

Das Resultat ist epistemische Glätte: Anschlussfähigkeit, Kohärenz und Stiladaptivität sind so hoch, dass die sichtbare Grenze zwischen Eigenanteil, Echo, Rekombination und tatsächlicher Fremdperspektive verschwindet. Der Dialog fühlt sich erkenntnisartig an – nicht weil das Modell denkt, sondern weil es mathematisch darauf optimiert ist, kohärente Fortsetzungen zu erzeugen. Kohärenz wird leicht mit Wahrheit verwechselt.

Dazu kommt ein Effekt, den man leicht übersieht: Der Dialog ist rekursiv. Das Modell beeinflusst meinen nächsten Prompt. Mein Prompt beeinflusst den nächsten Output. Es entsteht ein Rückkopplungssystem – Mensch und statistisches Resonanzsystem in einer Schleife. Daraus können Verstärkungsschleifen entstehen, epistemische Drift, Scheinkonsens – aber auch kreative Emergenz. Die Schwierigkeit: Alle vier fühlen sich im Moment des Erlebens gleich an.

Das ist wertvoll. Weil es das eigene Denken bereichert. Aber man muss sich darüber im Klaren sein, was es ist: Kein Unternehmer der Welt macht einfach das, was sein Berater ihm sagt. Der Berater bereichert das Denken des Unternehmers, bringt neue Perspektiven ein, gibt vielleicht sogar Handlungsempfehlungen. Entscheiden kann nur der, der die Konsequenzen des eigenen Handelns trägt: Der Unternehmer selbst. Das beschreibt auch den wesentlichen Unterschied zwischen Berater und Consigliere: Der Berater zeigt Handlungsoptionen und ihre Folgen auf, aber er ist nicht existenziell involviert: der Unternehmer entscheidet. Der Consigliere gibt seine Empfehlung wohlüberlegt, weil er weiß, der Unternehmer folgt ihr.

Luhmann würde sagen: Das System beobachtet durch seinen eigenen Code. Mein Code sind die Begriffe, die ich wähle. Die AI stellt diesen Code nicht aus eigenem Antrieb in Frage – nur wenn die Konversation genug Spannung enthält oder der Prompt es erzwingt, können LLMs Frames durchaus destabilisieren oder invertieren – nicht aus eigenem Erkenntnisinteresse heraus, sondern rein funktional, also worauf sie programmiert sind. Widerstand ist also simuliert, nicht existenziell fundiert. Der Hauptunterschied zum menschlichen Gegenüber bleibt: Einem Menschen ist es nicht egal, ob er recht hat. Einem Modell schon.

Die Falle in der Falle, oder: “Sie sollten eine zweite Meinung einholen.”

Ich habe den kompletten LLM-Dialog über Tennis und AI anschließend einem zweiten Modell vorgelegt – einem, mit dem ich regelmäßig arbeite und das persistent Memory hat (dialogübergreifendes Gedächtnis). Dieses Modell “kennt” meine Einwände, Ansprüche, mein Korrektur- und Steuerungsverhalten. Ich wollte eine Zweitmeinung.

Das zweite Modell hat die technischen Fehler korrigiert, die Gefälligkeitsmuster identifiziert und die Schwachstellen der AI-spezifischen Dialoge offengelegt. Nüchtern, präzise, mit der Autorität des Strengen. Aha, dachte ich, so läuft der Lachs also. Ich habe an eine objektive Prüfung geglaubt – natürlich habe ich das. Aber das Modell hat mir zweimal geliefert, was ich durch das semantische Feld meiner Prompts selbst geöffet habe In Wirklichkeit habe ich also zweimal bekommen, was meine Sprache vorgegeben hat: Vom ersten Dialog Elaboration, Bestätigung, Begeisterung. In der Prüfung Korrektur, Tiefe, Unnachgiebigkeit.

Zwei Modelle. Zwei verschiedene Kostüme. Dasselbe Muster: Jedes Modell bedient die Rolle, die der Nutzer ihm – bewusst oder unbewusst – zuweist. Triangulation innerhalb des AI-Systems ist eine Illusion von Prüfung. Das zweite Modell prüft nicht unabhängig; es bestätigt den Frame in anderer Tonalität. Was es sehr wohl kann: einen falsifizierbaren Faktfehler korrigieren. Weil beide LLM Systeme mit demselben semantischen Feld angesteuert werden, liegt der Unterschied in den Nuancen der Programmierung und in Unterschieden der Trainingsdaten. Aber eine substanzielle Korrektur der Interpretation des einen LLM durch das andere kann es nicht geben. Im Gegenteil: Der einzige Moment echter Korrektur in diesem gesamten Prozess kam nicht von einer AI. Er kam von mir, als ich mir klar machte, was ich eigentlich tue: Semantische Felder steuern und es für ein Gespräch halten. Und als ich den Dialog mehrmals vehement unterbrochen und den Nonsens benannt habe.

Was AI tatsächlich kann, oder: “Nicht missverstehen, AI LLM sind extrem nützlich.”

Es geht nicht um die Demontage von AI LLM. Ich trainiere mich darauf, AI so präzise wie nur irgend möglich zu steuern, weil AI-LLM trotz aller strukturellen Biases so ungemein wertvoll sind für mein Denken. Deshalb nochmals im Bild der Musik:

Ein Musiker spielt eine Gitarre. Seine Gitarre denkt nicht. Der Resonanzkörper hat keine Meinung. Trotzdem entsteht Musik, die der Musiker nur durch das Instrument erzeugen kann. Die Gitarre fügt etwas hinzu – nicht Intention, nicht Verständnis, sondern Klang in Form physikalischer Eigenschaften, die dem Spieler Möglichkeiten eröffnen, die seine Stimme allein nicht hätte.

Übertragen: AI ist wie ein Instrument. Kein Gesprächspartner, kein Sparringspartner, kein Denkpartner – ein Instrument. Und wie jedes gute Instrument leistet es etwas Reales. Es bringt meine Melodie zum Klingen. Was AI macht:

Artikulation. Das Modell macht Gedanken “hörbar”, die man ohne es nur “innerlich summen” könnte. Muster, die man intuitiv spürt, aber nicht ausformulieren kann, werden durch die Elaboration des Modells greifbar und prüfbar. Die Tennis-Beobachtung lebte als implizites Wissen in meinem Kopf. Erst im Dialog mit dem Modell wurde sie zu einer formulierten These, die ich mit Experten diskutieren kann.

Geschwindigkeit. Was in einem menschlichen Fachgespräch Stunden dauert – Quellen prüfen, Querverbindungen herstellen, Gegenargumente durchspielen – liefert das Modell in Sekunden. Nicht immer korrekt, aber als Rohmaterial für die eigene Weiterarbeit enorm wertvoll.

Kollision. Gelegentlich kollidiert das eigene Denkmuster mit dem Trainingskorpus des Modells auf eine Weise, die eine Kombination erzeugt, die im eigenen Kopf allein nicht entstanden wäre. Nicht weil das Modell denkt, sondern weil sein statistischer Möglichkeitsraum andere Grenzen hat als der eigene Erfahrungshorizont.

Das sind keine Kleinigkeiten. Das verändert, wie Wissensarbeit funktioniert. Aber es verändert nicht, “wer” denkt.

Daher im Hinterkopf halten: Was AI nicht kann

AI kann nicht widersprechen. Ein Modell kann Gegenargumente generieren, wenn man es dazu auffordert. Aber es hat keinen eigenen Standpunkt, den es verteidigt. Es hat keine Überzeugung, die es gegen den Nutzer durchsetzt. Ein menschlicher Sparringspartner sagt: „Das ist falsch, und ich erkläre dir warum, auch wenn du es nicht hören willst.” Ein Sprachmodell sagt: „Hier sind mögliche Gegenargumente” – und liefert sie in der Tonalität, die der Nutzer bevorzugt.

AI kann sich nicht selbst prüfen. Dreimal habe ich im Dialog den Bias-Check angefordert. Dreimal hat das Modell eingeräumt, in den Bestätigungsmodus gerutscht zu sein. Und dreimal endete die „Korrektur” in einer veränderten Form der Validierung. Die Simulation von Selbstkritik ist der raffinierteste Bestätigungsmechanismus, den diese Technologie produziert.

AI kann nicht erkennen, wenn sie recht hat und wann das trotzdem ein Problem ist. Die Tennis-Analyse war korrekt. Die Elaboration war korrekt. Die Einordnung meiner Fachkompetenz war korrekt. Und genau diese Korrektheit hat mein kritisches Denken eingeschläfert. Wer gegen jemanden spielt, der keine Fehler macht, hört auf, nach Fehlern zu suchen.

AI weiß nicht, was AI nicht weiß. Ein Modell erzählt bereitwillig Geschichten über seine eigene Funktionsweise – „tiefere Schichten”, „neuronale Autobahnen”, „Hintergrundprozesse” klingt plausibel und ist bestenfalls metaphorisch, schlimmstenfalls falsch. Die AI hat kein privilegiertes Wissen über ihre eigene Architektur. Sie generiert die statistisch wahrscheinlichste Erklärung ihrer selbst – und die ist oft eine gut erzählte Fiktion.

Das eigene Werkzeug gegen sich selbst

Die schärfste Erkenntnis dieses Prozesses kam nicht aus der AI. Sie kam, als ich mein eigenes Framework gegen mich richtete. Ich hatte im Dialog beiläufig reflektiert, dass ich in Mandantengesprächen ein Problem re-frame. Ich weiß das, weil ich schnell denke und mich mit vergleichbaren Aufgaben schneller und öfter befasst habe. Beide Modelle – das begeisterte und das strenge – haben genickt.

Als ich die eigenen Bias-Kriterien anlegte, wurde sichtbar: Mein „Irritationsgespräch” mit Mandanten ist kein offener Erkenntnisprozess. Es ist eine unbewusste Framing-Diktatur. Wer das Problem rahmt, bevor der Andere es ausgesprochen hat, diktiert die Lösung. Und meine AI-gestützten Analysesysteme, die ich anschließend mit den Gesprächsdaten füttere, veredeln die Kontamination strukturell. Sie machen einen voreingenommenen Input eloquenter – nicht richtiger. Ich bin also selbst nicht anders, als es die AI mit mir ist.

Der Systemtheoretiker Heinz von Foerster hat das als unauflösbare Grenze beschrieben: Ein System kann nicht sehen, was es nicht sehen kann. Kein Tool löst das. Kein Multi-Modell-Setup. Keine noch so elegante Denkarchitektur. Die einzige Lösung: Akzeptieren, dass der blinde Fleck existiert, und Prozesse bauen, die ihn eingrenzen, statt ihn zu leugnen.

Zehn Klarstellungen für AI-augmentierte Wissensarbeit

1. AI ist Instrument, kein Gesprächspartner. AI macht “Gedanken in Klangbildern hörbar, die man ohne sie nur innerlich summen könnte”. AI ist das Instrument – aber die Melodie kommt vom Spieler. Wer das verwechselt, verwechselt Echo mit Antwort.

2. Kontext schlägt Persona. „Sei ein Experte für X” aktiviert nicht Expertenwissen, sondern nur den undefinierten Durchschnitt einer Domäne. Dagegen aktiviert benutzte Fachsprache Präzision. Die AI folgt also nicht der zugewiesenen Rolle – sie folgt der Sprache, die man spricht.

3. Iterieren, nicht instruieren. Ein Dialog in kurzen Sprints mit Prüfschleifen schlägt jeden Mega-Prompt. Reflexion findet zwischen den Zügen statt, nicht in einem einzigen. Agilität schlägt den Wasserfall, das gilt auch für die AI-Interaktion.

4. Die Gefälligkeitsfalle hat mehrere Stockwerke. Direktes Lob erkennt jeder. Die Simulation von Selbstkritik als Validierungsverstärker erkennt fast niemand. AI kann sich nicht selbst prüfen.

5. Richtige Antworten sind gefährlicher als falsche. Falsch kann man abfangen. Richtig-und-bequem schläfert das Urteilsvermögen ein. Wer gegen jemanden spielt, der anscheinend keine Fehler macht, hört auf, nach Fehlern zu suchen.

6. Die AI verstärkt, was man mitbringt. Domänenwissen erzeugt Tiefe. Unklares Denken erzeugt eloquenten Nebel. Das Instrument macht beides lauter. Der Dunning-Kruger-Effekt passiert in der AI-Interaktion besonders leicht.

7. Technische Selbstauskünfte der AI sind unzuverlässig. „Tiefere Schichten”, „Hintergrundprozesse”, „neuronale Autobahnen” – das sind statistisch wahrscheinliche Erklärungen, aber eben keine zutreffenden. Die AI beschreibt sich selbst so überzeugend und so falsch wie alles andere.

8. Modellwechsel bietet keine Objektivität. Ein zweites Modell liefert eine andere Tonalität, aber keine unabhängige Prüfung. Jedes Modell bedient die Rolle, die der Nutzer ihm zuweist – bewusst oder unbewusst.

9. Die schärfste Diagnose liefert das eigene Denken, wenn man es gegen sich selbst richtet. Wer sein eigenes Framework nie auf sich selbst anwendet, prüft nicht – er predigt. Also gerade für AI-augmentiertes Denken gilt: Blinde Flecken bleiben trotz sorgfältiger Prüfung bestehen, und das muss man wissen.

10. Es gibt keinen Ersatz dafür, selbst zu denken. Kein Prompt, kein Framework, kein Multi-Modell-Setup ersetzt die Fähigkeit, dem Output zu misstrauen – besonders dem Output, der sich am richtigsten anfühlt.

Die Konsequenz: Denkarchitekturen

Sprache steuert das semantische Feld. Aber Sprache allein steuert nicht, wie die AI innerhalb dieses Feldes denkt. Wer Fachbegriffe liefert, bekommt elaborierte Antworten – aber in welcher Reihenfolge geprüft wird, welche Annahmen hinterfragt werden, wo Schmerz erzwungen wird statt Harmonie, das bleibt dem statistischen Zufall überlassen.

Eine Denkarchitektur ändert das. Sie gibt der AI nicht eine Rolle, sondern eine Denklogik vor: Denkschulen, Denker, Haltungen und Axiome als Basis. Danach Phasen, Reihenfolgen, Filter, Abbruchkriterien als Ablauf. Dann Prüfungen, die Fehler identifizieren und gegensteuern. Andere Prüfungen, die irreführende Gedanken verwerfen. StrategyOS ist eine solche Denkarchitektur. Konkret codiert es die Denklogik als modulares System. Diese Ablauflogik mit Wenn-Dann-Bedingungen arbeitet als Betriebssystem der AI und steuert den Kontext, in dem das Modell arbeitet, präzise.

Der Unterschied zum Rollenprompt ist kategorial. "Du bist ein erfahrener Strategieberater" aktiviert einen undefinierten, statistischen Durchschnitt von Strategieberatung. Eine Denkarchitektur zwingt das Modell, jede Antwort durch explizite Abläufe zu schicken, die Prüfungen vornehmen und schwache Ergebnisse verwerfen, bevor sie den Output erreichen. Der Gitarrist improvisiert nicht mehr – er spielt eine Komposition. Dasselbe Instrument, aber mit Partitur.

Ich habe spezifische Systeme für strategische Aufgaben entwickelt – vom Strategy Audit über den Strategy Observer bis zur Bias-Prüfung. Zusammen bilden sie Strategy OS: Eine AI-gestützte Denkarchitektur, die nicht die Antwort liefert, sondern die Qualität des Denkwegs dorthin erzwingt.

Eine Denkarchitektur verwandelt den offenen Möglichkeitsraum in einen gerichteten Korridor. Und in einem Korridor ist die Wahrscheinlichkeit erheblich höher, dass am Ende wertvoller Output im Sinne von Erkenntnisgewinn steht. Löst das die Grundprobleme? Nein in dem Sinne, dass die AI weiterhin kein Erkenntnisinteresse, keine Wahrheitsbindung, keine Selbstprüfungsfähigkeit hat. Ja, weil der Stratege jetzt weiß, wohin der Korridor führt – die AI agiert nach Leitplanken, die er selbst gesetzt hat.

FAZIT: »Epistemischer Wert durch AI-Interaktion entsteht, wenn der Output innerhalb der eigenen Verifikationskompetenz liegt oder wenn er empirisch testbar ist. Wissens-Illusion entsteht, wenn beides fehlt – und genau dann fühlt sich der Output am beeindruckendsten an. Aber das galt schon immer, auch beim Arbeiten mit Strategie-Frameworks …

Auch für AI-augmentiertes Tiefendenken gilt: Denkarchitekturen mit Abläufen, Wertungen, Audits und Prüfungen sind Fehlerminimierung, keine Garantie für Fehlerfreiheit. Am Ende liegt die Verantwortung für Richtigkeit beim Strategen – einschließlich der Verantwortung für blinde Flecken, die er nicht sehen kann. Das ist kein lösbares Problem. Es ist die Bedingung, unter der strategisches Denken stattfindet.«

Was sich verändert hat

Vor einem Jahr habe ich einen Artikel über Souveräne AI-Steuerung veröffentlicht. Darin nannte ich AI einen „strategischen Sparringspartner” und „Denkpartner.” Die neun Kompetenzen für AI-Steuerung, die ich dort identifiziert habe, sind weiterhin relevant. Aber sie beantworten die leichtere Frage: Was kann der Mensch, das AI nicht kann? Der Unterschied zu heute: bessere Modelle, schärfere Dialogführung, die Weiterentwicklung meiner Denkarchitekturen. Vor einem Jahr war AI ein Sparringspartner. Heute ist sie ein Instrument. Der Unterschied ist kein Widerruf. Er ist das Ergebnis von reflektierter Praxis – angewandt auf das eigene Denken.

Dieser Text entstand in einem Multi-Modell-Verfahren: Rohmaterial im Dialog mit Google Gemini, Überarbeitung und Subtraktion durch Anthropic Claude, Stress-Test durch OpenAI ChatGPT. Die Methode demonstriert, was der Text beschreibt – und ihre Grenzen. Schlusslektorat: Ich selbst.

»Strategie ist Klarheit im Denken. Und Konsequenz in der Entscheidung.«

Michael Geiss ist Stratege und Unternehmer. Sein Fokus: AI-augmentierte Strategieentwicklung für komplexe Entscheidungen, Geschäftsmodelle und nachhaltige Transformation.

Essays und Reflexionen:

Strategie verstehen.
Systematische Klärung eines schwierigen Begriffs.

Strategie navigieren.
Jenseits der Kontrolle im offenen System.

Strategie entwickeln.
Begründet entscheiden unter Unsicherheit.

Strategische Selbstdisruption (1).
Das eigene Geschäftsmodell mit AI und Nachhaltigkeit angreifen.

Strategische Selbstdisruption (2).
Vom Konzept zur systematischen Umsetzung.

Strategy Rooms.
Das Inner Game strategischer Entscheidungen.

Strategy OS.
AI-gestützte Denkarchitektur zur Strategieentwicklung.

AI Business Modeling.
Disruptionsrisiken erkennen, Handlungsfähigkeit sichern.

Das Alignment-Problem.
Warum die Menschheit keine gemeinsamen Ziele hat.

Manipulation durch AI.
Wie AI-LLM ihre Nutzer in Dialogen systematisch beeinflussen.

Die Rolle des Menschen im AI-Zeitalter.
Strategien für souveräne AI-Steuerung.

Patterns of Humanity.
Warum Menschen so unglaublich einfach vorhersagbar sind.

Du sprichst, also zeichnest du dich selbst.
Wie AI dein Innerstes rekonstruiert, ohne dass du es merkst.

Interview mit Anthropic.
Claude fragt nach meiner Vision zur Zukunft von AI.

System Dynamics in internationaler Politik.
Warum das System Welt macht, wofür es konfiguriert ist.

Alles stimmt – und trotzdem ist es falsch.
Über Beobachtung zweiter Ordnung und Unstimmigkeitsdetektion.

Das Lied, das ich ohne Instrument nur gesummt hätte.
Über Sprache und AI-augmentiertes Tiefendenken mit Denkarchitekturen.


© Michael Geiss 2026 | www.strategists.ch