Harness. KI checken

Du hast jetzt gelernt, was ein Large Language Model ist und wie du es über eine API ansprechen kannst. Aber etwas fehlt noch in der Geschichte. Wenn du dich mit ChatGPT oder Claude unterhältst, redest du nicht mit einem nackten Modell. Da ist eine ganze Schicht Software dazwischen, und die nennt man Harness.

Die Pferd-und-Geschirr-Analogie

Analogie

Ein Pferd alleine zieht keine Kutsche. Es hat Kraft, ja. Es kann laufen, ja. Aber damit aus dieser Kraft etwas Nützliches wird. Wagen ziehen, Lasten transportieren, in einer geraden Linie laufen, braucht es ein Geschirr: harness auf Englisch. Das Geschirr verbindet die Kraft mit der Welt. Genauso ist es bei einer KI.

Ein Sprachmodell ist im Kern eine Funktion, die Text generiert. Mehr nicht. Es kann nicht von alleine im Internet suchen, keine Datei öffnen, keine E-Mail verschicken, keinen Code ausführen, nichts merken, was vor zehn Minuten besprochen wurde. Es generiert Text. Punkt.

Damit aus dieser nackten Fähigkeit ein echtes Werkzeug wird, muss jemand drum herum bauen: einen Chat-Verlauf speichern, dem Modell Werkzeuge zur Verfügung stellen, die Antworten auswerten, Sicherheitsfilter einbauen, eine Benutzeroberfläche zeichnen. Diese ganze Hülle ist der Harness.

Was ist ein Harness genau?

Ein Harness ist die Software-Hülle um ein KI-Modell, die regelt:

Was das Modell zu Beginn jedes Gesprächs sieht (System-Prompt).
Welche Werkzeuge es benutzen darf (Dateien lesen, im Web suchen, Code ausführen, etc.).
Was passiert, wenn das Modell ein Werkzeug benutzen will: das Ausführen der Aktion und das Zurückspeisen des Ergebnisses.
Wie der Verlauf gespeichert wird, damit das Modell sich an frühere Nachrichten erinnert.
Welche Sicherheitsregeln gelten, welche Aktionen genehmigt werden müssen, welche verboten sind.
Wie die Benutzeroberfläche aussieht.

Merke

Das Modell ist der Motor. Der Harness ist alles drumherum: Karosserie, Lenkrad, Bremsen, Armaturenbrett, Sicherheitsgurt. Erst aus beidem zusammen wird ein Auto, in das man einsteigen kann.

Beispiele aus der echten Welt

Die wichtige Einsicht: Dasselbe Modell kann in vielen verschiedenen Harnesses leben. Du kennst vermutlich schon mehrere, ohne es zu wissen.

ChatGPT.com

Ein Web-Harness um GPT-Modelle. Speichert Chats, kennt Werkzeuge wie Web-Suche und Bild-Generierung, bietet eine freundliche Oberfläche.

Claude Desktop

Ein Desktop-Harness um Claude. Kann sich mit lokalen Programmen verbinden (über MCP), Dateien anzeigen, lange Verläufe halten.

Claude Code

Ein Kommandozeilen-Harness, der Claude direkt Zugriff auf dein Dateisystem, Git und die Shell gibt. Speziell für Programmierarbeit gebaut.

Cursor / GitHub Copilot

Code-Editor-Harnesses, die verschiedene Modelle einbinden und sie direkt in deinen Editor integrieren, mit Datei-Kontext, Tab-Vervollständigung, Code-Diffs.

Wenn du Claude bei ChatGPT.com nicht findest, liegt das nicht am Modell, sondern am Harness.

Warum dasselbe Modell sich plötzlich anders verhält

Das ist der Punkt, an dem viele Anfänger stutzen. Du benutzt Claude im Web-Chat und es fühlt sich freundlich-erklärend an. Du benutzt dasselbe Claude in Claude Code, und es schreibt plötzlich knapper, technischer, will Tools benutzen, fragt nach Datei-Pfaden. Hat das Modell zwei Persönlichkeiten?

Nein. Der Harness gibt dem Modell zu Beginn jedes Gesprächs eine andere Rolle mit. Im Web-Chat sagt der System-Prompt sinngemäß: "Du bist ein hilfreicher Assistent, antworte freundlich und erklärend." In Claude Code sagt er: "Du bist ein Software-Engineer-Assistent, sei direkt, präzise, benutze diese Werkzeuge, halte dich an diese Regeln." Anderes Skript, anderes Verhalten, derselbe Schauspieler.

Beispiel

Ein Restaurant kann mit dem Anthropic-SDK seinen eigenen Reservierungs-Chatbot bauen. Der Harness wäre dann: ein Web-Widget auf der Restaurant-Seite, ein System-Prompt ("Du buchst Tische für das Restaurant Sonne"), Tools für Datenbank-Abfragen ("Ist Samstag 19 Uhr frei?"), Sicherheitsregeln (keine fremden Themen, kein Sprachwechsel). Dasselbe Claude-Modell wie in ChatGPT-ähnlichen Produkten, nur mit anderem Geschirr.

Der Agent-Loop, das Herz des Harness

Wenn ein Harness der KI Werkzeuge gibt, läuft im Hintergrund eine kleine Schleife, die man Agent Loop nennt. Sie ist erstaunlich simpel, und sie ist die ganze "Magie" hinter KI-Agenten:

Schritt 1. Modell anrufen

Der Harness schickt dem Modell den aktuellen Verlauf und eine Liste aller verfügbaren Werkzeuge ("Du darfst lesen, suchen, ausführen, schreiben"). Dann fragt er: "Was machst du als Nächstes?"

Schritt 2. Antwort lesen

Das Modell antwortet entweder mit Text ("Hier ist deine Antwort: ...") oder mit einem Werkzeug-Wunsch ("Bitte führe das Werkzeug datei_lesen aus mit dem Argument notiz.txt").

Schritt 3. Werkzeug ausführen

Wenn das Modell ein Werkzeug benutzen will, führt der Harness die Aktion aus, er öffnet die Datei, sucht im Web, schreibt etwas. Das Modell selbst macht nichts. Der Harness ist die Hand.

Schritt 4. Ergebnis zurückspielen

Der Harness fügt das Ergebnis ("Inhalt der Datei: ...") an den Verlauf an und ruft das Modell erneut auf. Das Modell sieht jetzt: "Aha, die Datei enthält das."

Schritt 5. Wiederholen oder fertig

Die Schleife läuft, bis das Modell sagt: "Ich bin fertig" und nur noch Text zurückgibt. Dann zeigt der Harness diesen Text dem Nutzer.

Das ist die ganze Architektur hinter Programmen wie Claude Code oder Cursor. Eine Schleife, die das Modell befragt, seine Werkzeug-Wünsche ausführt und das Ergebnis zurückgibt, wieder und wieder, bis die Aufgabe erledigt ist.

Der Agent-Loop

Was zwischen deinem Prompt und der fertigen Antwort wirklich passiert.

Das Modell denkt nicht in einem Rutsch. Der Harness wiederholt diese Schleife immer wieder, bis die KI selbst sagt "ich bin fertig".

Was ein guter Harness ausmacht

Nicht alle Harnesses sind gleich. Was unterscheidet einen guten von einem schlechten?

Kontext-Management: Welche Dateien, welcher Verlauf, welche Hinweise gibt der Harness dem Modell mit? Zu wenig, und das Modell rät. Zu viel, und es wird verwirrt und teuer.
Sinnvolle Werkzeuge: Eine Liste von 200 Werkzeugen ist nicht hilfreich. Gute Harnesses bieten wenige, klar beschriebene Werkzeuge.
Berechtigungen: Welche Aktionen darf die KI ohne Rückfrage, welche müssen vom Nutzer freigegeben werden? Eine Datei löschen ist nicht dasselbe wie eine Datei lesen.
Fehler-Behandlung: Was passiert, wenn ein Werkzeug fehlschlägt? Ein guter Harness teilt das dem Modell mit, damit es einen anderen Weg suchen kann.
Transparenz: Sieht der Nutzer, was die KI gerade tut? Oder ist es eine Blackbox?

Vorsicht

Ein Harness kann das gleiche Modell sehr nützlich oder sehr gefährlich machen. Ein Harness ohne Berechtigungs-Checks, der dem Modell freien Zugriff auf dein Dateisystem oder dein Bankkonto gibt, ist ein Problem. Mehr dazu im Kapitel Safety.

Harness ist nicht gleich Agent

Die Begriffe werden manchmal vermischt, sind aber nicht dasselbe. Ein Harness ist die Hülle. Ein Agent ist das, was entsteht, wenn der Harness dem Modell echte Handlungsfähigkeit gibt (Tools, mehrere Schritte, eigenständige Entscheidungen). Mehr dazu im nächsten Kapitel.

Du kannst dir merken: Jeder Agent läuft in einem Harness. Aber nicht jeder Harness erzeugt einen Agent, ein einfacher Web-Chat ohne Tools ist auch schon ein Harness, nur eben ein minimaler.

Merke

Wenn dich jemand fragt: "Welches Modell ist das beste?", dann ist das nur die halbe Frage. Genauso wichtig ist: in welchem Harness läuft es? Ein mittelgroßes Modell in einem guten Harness schlägt oft das größte Modell ohne Werkzeuge.

In drei Sätzen

Was du jetzt weißt

Ein Harness ist die Software-Hülle um ein KI-Modell. System-Prompt, Werkzeuge, Verlauf, Sicherheit und Oberfläche zusammen.
Dasselbe Modell verhält sich in unterschiedlichen Harnesses völlig anders. ChatGPT.com, Claude Code und Cursor sind verschiedene Harnesses um teils dieselben Modelle.
Im Inneren läuft ein Agent Loop: Modell fragen, Werkzeug-Wunsch ausführen, Ergebnis zurückspielen, wiederholen bis fertig.