Training & Daten. KI checken

Trainingsdaten, das Rohmaterial

Eine KI lernt aus Beispielen. Punkt. Sie braucht Trainingsdaten, sehr viele davon. Für ein modernes Sprachmodell sind das im Wesentlichen Texte: Websites, Bücher, Forenbeiträge, Wikipedia, wissenschaftliche Arbeiten, Code-Repositories. Für eine Bilder-KI sind es Milliarden von Bildern, meistens mit kleinen Beschriftungen ("ein roter Apfel auf einem Tisch"). Für eine Sprach-KI sind es Stunden um Stunden von Audio-Aufnahmen.

Die Mengen sind schwer vorstellbar. Ein großes Sprachmodell wird oft mit Datenmengen trainiert, die hunderten Milliarden bis Billionen Wörtern entsprechen, mehr Text, als ein Mensch in tausend Leben lesen könnte. Genau deshalb wirken die Modelle so belesen: Sie haben quasi das Internet gelesen.

Analogie

Stell dir Trainingsdaten wie die Schulbibliothek einer Schülerin vor, nur eben mit einer Bibliothek so groß wie eine ganze Stadt. Was in dieser Bibliothek steht, formt das, was die Schülerin später als "normal" oder "richtig" empfindet. Fehlt etwas, weiß sie es nicht. Steht viel Falsches drin, übernimmt sie das.

Der Lernprozess: millionenfach raten und sich verbessern

Wenn das Training startet, sind die Gewichte des neuronalen Netzes zufällig gesetzt. Das Netz weiß im wahrsten Sinne des Wortes nichts. Wenn du ihm in diesem Zustand einen halben Satz zeigen würdest, würde es kompletten Unsinn vorhersagen. Und dann beginnt der eigentliche Trick, er klingt simpel, aber er ist das Herz aller modernen KI:

Das Modell bekommt ein Beispiel

Ein Stück Text aus den Trainingsdaten. Etwa: "Die Hauptstadt von Frankreich ist ____". Das letzte Wort wird abgedeckt.

Das Modell rät

Mit den aktuellen, noch zufälligen Gewichten produziert es eine Vorhersage. Am Anfang wahrscheinlich Quatsch wie "Banane" oder "blau".

Der Fehler wird gemessen

Das System vergleicht die Vorhersage mit der echten Antwort ("Paris") und berechnet, wie weit daneben es lag.

Die Gewichte werden minimal angepasst

Jedes der Milliarden Gewichte wird ein winziges Stück in die Richtung verschoben, die den Fehler kleiner macht. Diesen Schritt nennt man Backpropagation.

Wiederholen, viele Milliarden Male

Schritt 1 bis 4 läuft mit immer neuen Textstücken. Nach Milliarden Wiederholungen liegt das Modell bei den meisten Beispielen ziemlich richtig.

Das ist der gesamte Trick. Jeder einzelne Schritt ist banal, ein klitzekleiner Schubs in die richtige Richtung. Aber die schiere Menge an Wiederholungen mit unfassbar vielen Beispielen sorgt dafür, dass am Ende ein Modell entsteht, das eine ganze Menge "weiß".

Analogie

Wie Vokabeln pauken, aber millionenfach. Stell dir vor, du würdest jeden Tag tausend neue Karteikarten durchgehen, jeden Fehler korrigieren, und das fünf Jahre lang. So lernt eine KI. Nur viel schneller und viel mehr Karten.

Die KI lernt nicht, was wahr ist. Sie lernt, was passt.

So sieht es aus, wenn eine KI lernt

Der Fehler wird mit jeder Trainingsrunde kleiner, anfangs schnell, später langsamer.

Am Anfang macht die KI fast nur Quatsch. Mit jeder Runde rät sie etwas besser. Irgendwann bringt jede zusätzliche Stunde Training kaum noch Verbesserung, das ist normal.

Die drei Phasen: Pre-Training, Fine-Tuning, RLHF

Bei modernen Sprachmodellen läuft das Training nicht in einem Rutsch durch, sondern in drei Phasen. Jede Phase hat einen Zweck, und du wirst die Namen oft hören.

1. Pre-Training: die Grundbildung

Im Pre-Training liest das Modell riesige Mengen Rohtext, das Internet, Bücher, Code, alles Mögliche. Sein einziges Ziel: das nächste Wort vorhersagen. Genau das, was wir im Kapitel "Wie funktioniert KI?" beschrieben haben.

Hier entstehen die Grundlagen: Grammatik, Vokabular, Weltwissen, ein Gefühl für Sprache. Aber das Modell nach dem Pre-Training ist noch kein netter Chat-Partner. Es ist eher wie ein extrem belesenes, aber etwas wirres Buch, es kann jeden Stil imitieren, weiß tausende Fakten, aber es weiß noch nicht, dass du eine konkrete Frage gestellt hast und eine konkrete Antwort willst.

Pre-Training ist der teuerste Schritt. Es dauert Wochen bis Monate, kostet viele Millionen und braucht riesige Mengen an Rechenleistung. Deshalb gibt es nur eine Handvoll Firmen, die das überhaupt von Grund auf machen.

2. Fine-Tuning: die Berufsausbildung

Im Fine-Tuning bekommt das Modell deutlich weniger, aber gezieltere Beispiele. Etwa Tausende Frage-Antwort-Paare, die zeigen, wie ein hilfreicher Assistent reagieren sollte. Das Modell wird "spezialisiert", auf nettes Antworten, auf eine bestimmte Domäne, auf ein bestimmtes Format.

Stell dir vor, jemand hat sehr viele Bücher gelesen, aber noch nie als Kellnerin gearbeitet. Fine-Tuning ist dann die zweiwöchige Einweisung im Restaurant: Was sagt man, wenn jemand reinkommt? Wie nimmt man eine Bestellung auf? Das Grundwissen war schon da, jetzt kommt die Rolle dazu.

3. RLHF: der Schliff durch menschliche Bewertung

Der vielleicht wichtigste Schritt für Modelle wie ChatGPT trägt einen sperrigen Namen: RLHF, Reinforcement Learning from Human Feedback. Übersetzt: bestärkendes Lernen aus menschlichem Feedback. Klingt kompliziert, ist aber im Kern simpel.

Menschen bekommen mehrere Antworten der KI auf dieselbe Frage zu sehen und bewerten, welche besser ist. "Diese Antwort ist freundlicher." "Diese ist genauer." "Diese ist hilfreicher." Aus diesen Tausenden von Bewertungen lernt das Modell, welche Art von Antwort Menschen bevorzugen, und passt sich an.

Merke

RLHF ist der Grund, warum moderne Chat-KIs so höflich, hilfreich und vorsichtig wirken. Ohne RLHF wären sie ungefiltert, manchmal beeindruckend, manchmal schroff, manchmal komplett daneben. Mit RLHF werden sie zu "Assistenten", aber sie verlieren auch ein bisschen ihrer rohen Spontaneität.

Garbage in, garbage out

Es gibt einen Spruch aus der Informatik, der für KI besonders treffend ist: Garbage in, garbage out. Müll rein, Müll raus. Egal wie elegant die Architektur, wie groß das Modell, wie clever der Trainingsalgorithmus, wenn die Daten schlecht sind, wird auch das Ergebnis schlecht.

Was bedeutet "schlechte Daten"? Mehrere Dinge:

Falsche Daten: Wenn im Internet hundert Mal steht, dass Berlin in Belgien liegt, könnte das Modell genau das lernen.
Einseitige Daten: Wenn 90 % der Trainingstexte aus einem bestimmten Kulturkreis stammen, wird das Modell die Welt aus dieser Perspektive sehen.
Veraltete Daten: Wenn die Trainingsdaten 2023 enden, weiß das Modell nichts über 2024.
Gefilterte oder gefärbte Daten: Wenn jemand bewusst nur bestimmte Meinungen einspeist, lernt das Modell diese als Standard.

Beispiel

Eine frühe KI zur Bewerber-Auswahl bei einem großen Tech-Konzern wurde mit Bewerbungen aus den letzten zehn Jahren trainiert. In dieser Zeit wurden überwiegend Männer eingestellt. Die KI lernte daraus: Bewerber mit männlichen Mustern sind erfolgreich. Sie fing an, Bewerbungen von Frauen systematisch schlechter zu bewerten. Das System wurde wieder abgeschaltet, aber es zeigt, wie schnell ein Bias in den Daten zu einem Bias in der KI wird.

Bias, wie Vorurteile in die KI kommen

Das Wort Bias bedeutet so viel wie Voreingenommenheit oder systematischer Fehler. KI-Bias entsteht fast immer dadurch, dass die Trainingsdaten die Welt nicht ausgewogen abbilden, und das ist in der Praxis fast unvermeidbar. Das Internet ist nicht repräsentativ. Bücher sind nicht repräsentativ. Wikipedia ist nicht repräsentativ. Jede Datenquelle hat ihre eigenen Schiefen.

Solche Schiefen wandern in die Modelle. Bilder-KIs, die mit überwiegend westlichen Fotos trainiert wurden, generieren bei "Hochzeit" eher westliche Hochzeiten. Sprachmodelle übernehmen Klischees aus den Texten, die sie gelesen haben. Übersetzungs-KIs übersetzen geschlechtsneutrale Wörter aus dem Englischen in stereotype Rollen ("the doctor" wird zu "der Arzt", "the nurse" zu "die Krankenschwester").

Vorsicht

Bias in KI ist selten böse Absicht, er ist meist ein Spiegel unserer Welt und unserer Daten. Aber: Wenn KI in Bewerbungsverfahren, Kreditvergaben oder bei Polizei und Justiz eingesetzt wird, können diese Schiefen reale Menschen treffen. Eine KI ist nie "neutral", nur weil sie eine Maschine ist. Sie ist genau so neutral wie die Daten, mit denen sie gefüttert wurde.

Was bedeutet das für dich als Nutzer?

Wir können das Training einer KI nicht selbst beeinflussen, das machen die Firmen, die die Modelle bauen. Aber wenn du verstehst, wie Training funktioniert, kannst du KI bewusster nutzen:

Stichtag beachten

Frag nach dem "Knowledge Cutoff" deines Modells. Alles danach kennt es nicht. Frage nach aktuellen Ereignissen ist riskant.

Quellen prüfen

Die KI hat zwar viel gelesen, kann aber nicht zitieren, woher sie etwas weiß. Bei wichtigen Fakten: nachprüfen.

Bias mitdenken

Bei Themen wie Geschlecht, Kultur, Politik die Antworten kritisch lesen. Die KI kann unbemerkt Klischees übernehmen.

Nischen sind dünn

Für sehr spezialisierte Themen ist meist wenig Trainingsdaten vorhanden. Die KI antwortet trotzdem, vorsichtig sein.

Lernen ist nicht Verstehen

Zum Abschluss noch ein wichtiger Gedanke. Ein neuronales Netz lernt aus Daten, aber das "Lernen" hier ist nicht dasselbe wie unser menschliches Lernen. Das Modell baut keine Konzepte im philosophischen Sinne auf. Es findet statistische Regelmäßigkeiten und speichert sie in seinen Gewichten.

Das ist beeindruckend. Es reicht für viele praktische Aufgaben. Aber es ist auch der Grund, warum eine KI in unerwarteten Situationen so schnell danebenliegen kann: Sobald die Frage außerhalb der Muster ist, die das Training abgedeckt hat, fängt die KI nicht an zu überlegen, sie würfelt weiter im Wahrscheinlichkeitsraum. Im nächsten Kapitel schauen wir uns konkret an, wie aus all dem ein "Large Language Model" wird.

In drei Sätzen

Was du jetzt weißt

Eine KI lernt aus riesigen Mengen Beispieldaten, durch millionenfaches Raten, Fehler messen und winzige Anpassungen der Gewichte (Backpropagation). Wie Vokabeln pauken, nur in unfassbar großem Maßstab.
Moderne Sprachmodelle entstehen in drei Phasen: Pre-Training (Grundbildung aus dem Internet), Fine-Tuning (Spezialisierung), und RLHF (Schliff durch menschliche Bewertung).
"Garbage in, garbage out" gilt überall: Schlechte oder einseitige Daten erzeugen schlechte oder voreingenommene Modelle. Bias in KI ist fast immer ein Spiegel der Trainingsdaten, und kein neutraler Maschinen-Standpunkt.

← Vorheriges Kapitel

Neuronale Netze

Nächstes Kapitel →

Large Language Models