Neuronale Netze. KI checken

Inspiriert vom Gehirn, aber keine Kopie

Wenn du "neuronales Netz" hörst, denkst du vielleicht an Bilder von Nervenzellen, Synapsen, blinkenden Verbindungen im Kopf. Das ist nicht ganz falsch, die ersten Forscher in den 1940er und 50er Jahren haben sich tatsächlich vom menschlichen Gehirn inspirieren lassen. Aber: Ein künstliches neuronales Netz ist keine Kopie des Gehirns. Es ist eine grobe mathematische Vereinfachung, die einige Ideen aufgreift.

Das Gehirn hat etwa 86 Milliarden Nervenzellen, die in unglaublich komplexer Weise miteinander verbunden sind. Ein neuronales Netz im Computer hat ein paar Millionen bis ein paar hundert Milliarden "künstliche Neuronen", aber diese sind extrem simpel im Vergleich zu echten Nervenzellen. Trotzdem reicht diese Vereinfachung erstaunlich weit.

Merke

"Neuronales Netz" ist eine Metapher, kein Modell des Gehirns. Es bedeutet: Viele kleine Rechen-Einheiten arbeiten zusammen, organisiert in Schichten. Das hat mit dem biologischen Original ungefähr so viel zu tun wie ein Papierflieger mit einem Flugzeug.

Was ist ein künstliches Neuron?

Ein Neuron in der KI ist im Grunde eine kleine Rechenmaschine. Es bekommt Zahlen rein, von anderen Neuronen oder von außen, und gibt eine Zahl raus. So einfach. Aber zwischen Eingabe und Ausgabe passiert etwas Spannendes: Das Neuron gewichtet jede Eingabe. Manche Eingaben sind ihm wichtig, manche sind ihm fast egal.

Konkret macht das Neuron drei Dinge:

Es nimmt alle Eingabewerte entgegen.
Es multipliziert jeden Eingabewert mit einem Gewicht. Dieses Gewicht ist eine Zahl, die sagt, wie wichtig die Eingabe ist.
Es addiert die gewichteten Werte zusammen, und entscheidet anhand des Ergebnisses, welches Signal es selbst weitergibt.

Analogie

Stell dir ein Neuron wie einen Schiedsrichter in einem Komitee vor. Mehrere Berater (die Eingaben) flüstern ihm gleichzeitig Empfehlungen zu. Manche Berater hört er sehr aufmerksam zu (hohes Gewicht), andere nimmt er kaum wahr (niedriges Gewicht). Am Ende bildet er sich aus all dem eine Meinung und gibt seine Entscheidung weiter.

Das beeindruckendste: Ein einzelnes Neuron ist nicht besonders schlau. Es macht buchstäblich nur eine Multiplikation, eine Addition und eine kleine Entscheidung. Die Magie entsteht erst, wenn man Tausende oder Millionen davon zusammenschaltet.

Schichten, der Aufbau eines Netzes

Neuronen werden in Schichten organisiert (englisch: layers). Eine typische Struktur sieht so aus:

Eingabe

Schicht 1

Schicht 2

Ausgabe

Ein Signal wandert durchs Netz

Eingabe links, Verarbeitung in der Mitte, Ausgabe rechts.

Jeder Kreis ist ein Neuron, jede Linie ein Gewicht. Beim Lernen werden diese Gewichte millionenfach angepasst, bis das Netz brauchbare Ausgaben produziert.

Eingabe-Schicht (Input): Hier kommen die Rohdaten an. Bei einem Bild zum Beispiel die Helligkeitswerte jedes Pixels. Bei Text die Tokens, die wir im letzten Kapitel kennengelernt haben.
Versteckte Schichten (Hidden Layers): Die Schichten dazwischen. Sie heißen "versteckt", weil du von außen nicht direkt siehst, was sie tun. Hier passiert die eigentliche Arbeit, und davon kann es viele geben.
Ausgabe-Schicht (Output): Hier kommt das Ergebnis raus. Bei einem Spam-Filter zum Beispiel eine Zahl zwischen 0 und 1: "Wie wahrscheinlich ist es, dass diese Mail Spam ist?"

Jedes Neuron einer Schicht ist meistens mit allen Neuronen der nächsten Schicht verbunden. Wenn du also vier Neuronen in einer Schicht hast und sechs in der nächsten, gibt es 4 × 6 = 24 Verbindungen, jede davon mit einem eigenen Gewicht. Bei großen Netzen sprechen wir schnell von Milliarden von Verbindungen.

Beispiel

Bei einer Bilderkennungs-KI, die Hunde von Katzen unterscheiden soll, machen die ersten Schichten oft etwas Einfaches: Sie erkennen Kanten, Ecken und Helligkeitsübergänge. Tiefere Schichten setzen daraus Formen zusammen. Augen, Ohren, Schnauze. Die letzten Schichten kombinieren das zu "Hund" oder "Katze". So baut das Netz aus simplen Bausteinen ein komplexes Verständnis auf.

Gewichte, das, was das Netz lernt

Wir haben das Wort Gewicht jetzt schon ein paar Mal gehört. Lass uns kurz klären, was genau das ist und warum es so wichtig ist.

Ein Gewicht ist einfach eine Zahl. Eine Zahl pro Verbindung zwischen zwei Neuronen. Diese Zahl bestimmt, wie stark das Signal von einem Neuron das nächste beeinflusst. Wenn das Gewicht groß ist, fließt viel Signal durch; ist es klein oder null, fließt fast nichts.

Und hier kommt der eigentliche Punkt: Diese Gewichte sind alles, was ein Netz "weiß". Wenn man sagt, "die KI hat gelernt", dann heißt das in Wahrheit: Die Milliarden von Gewichten wurden so eingestellt, dass das Netz bei bekannten Beispielen die richtigen Antworten gibt. Die Intelligenz, das Wissen, die Fähigkeiten, all das sitzt nicht in irgendwelchen Texten oder Datenbanken, sondern in diesen Zahlen.

Merke

Das "Gehirn" einer KI ist im Grunde eine sehr, sehr lange Liste von Zahlen, den Gewichten. Wenn jemand sagt, ein Modell hat "70 Milliarden Parameter", meint er ungefähr: Es gibt 70 Milliarden solcher Gewichte, die beim Training eingestellt wurden.

Was das Netz weiß, sitzt nicht in Wörtern. Es sitzt in Zahlen.

Deep Learning, wenn die Tiefe entscheidet

Du hast den Begriff Deep Learning bestimmt schon gehört. Das "Deep" steht für "tief", und gemeint ist: Das Netz hat viele Schichten übereinander. Frühe neuronale Netze in den 80ern hatten oft nur zwei oder drei Schichten. Heutige Netze haben Dutzende, Hunderte, manchmal Tausende.

Warum hilft Tiefe? Weil jede Schicht aus den Mustern der vorherigen Schicht etwas Komplexeres zusammensetzen kann. Eine flache Architektur kann nur einfache Zusammenhänge erkennen. Ein tiefes Netz kann Schritt für Schritt immer abstraktere Muster bauen, von Pixeln zu Kanten, von Kanten zu Formen, von Formen zu Objekten, von Objekten zu Bedeutung.

Flaches Netz

Wenige Schichten (2 bis 3)
Erkennt einfache Muster
Schnell trainiert
Stößt schnell an Grenzen
Heute eher für kleine, klar abgegrenzte Aufgaben

Tiefes Netz (Deep Learning)

Viele Schichten (Dutzende bis Hunderte)
Erkennt komplexe, abstrakte Muster
Braucht viel Daten und Rechenleistung
Basis für moderne KI
Hinter ChatGPT, Bilder-KI, Sprach-KI

Der Durchbruch des Deep Learnings kam um 2012, als ein tiefes Netz erstmals in einem berühmten Bilderkennungs-Wettbewerb alle klassischen Verfahren überraschend deutlich schlug. Seitdem dominiert Deep Learning fast alle interessanten KI-Probleme.

Warum tiefe Netze besser sind, die Idee dahinter

Stell dir vor, du sollst ein Gebäude beschreiben. Wenn du nur einen Satz hast, musst du sehr grob bleiben: "Ein großes Haus." Wenn du fünf Sätze hast, kannst du Stockwerke, Fenster, Material und Farbe erwähnen. Wenn du eine Seite hast, kommst du zu den Details: Architektur, Geschichte, Stimmung, Nachbarschaft.

Ähnlich ist es mit Schichten in einem Netz. Jede zusätzliche Schicht erlaubt eine feinere, abstraktere Beschreibung der Eingabe. Bei Sprache zum Beispiel: Die unteren Schichten "verstehen" Buchstabenfolgen und einzelne Wörter. Mittlere Schichten erkennen Satzbau, Grammatik, einfache Bedeutung. Tiefere Schichten erfassen Stil, Stimmung, Themen, ja sogar Argumentationsstrukturen.

Untere Schichten

Einfache, lokale Muster. Bei Bildern: Kanten und Farben. Bei Text: einzelne Wörter und Buchstaben.

Mittlere Schichten

Zusammensetzungen. Bei Bildern: Augen, Räder, Schriftzeichen. Bei Text: Sätze, Grammatik, kleine Phrasen.

Obere Schichten

Bedeutung und Kontext. Bei Bildern: "Hund spielt im Garten". Bei Text: Thema, Stimmung, Absicht.

Ausgabe

Die konkrete Antwort. Klassifikation, Vorhersage, das nächste Wort, ein erzeugtes Bild.

Vorsicht

Wir wissen nicht genau, was in den Zwischenschichten eines großen Netzes wirklich passiert. Forscher können einzelne Muster identifizieren, aber die Schichten als Ganzes sind eine Art Blackbox. Das ist ein offenes Forschungsfeld und einer der Gründe, warum KI manchmal überraschend versagt.

Eine wichtige Einsicht zum Schluss

Wir haben jetzt das Bild eines neuronalen Netzes vor Augen: Schichten von Neuronen, verbunden durch Gewichte, die Eingaben Stück für Stück in Ausgaben verwandeln. Was wir noch nicht besprochen haben, ist die spannendste Frage von allen: Wie kommen die Gewichte zu ihren Werten? Wer stellt die ein? Niemand stellt sie per Hand ein, das wären viel zu viele Zahlen.

Die Antwort lautet: Training. Das Netz lernt seine Gewichte selbst, indem es Millionen oder Milliarden Beispiele sieht und seine Gewichte nach jedem Beispiel ein winziges bisschen verbessert. Wie genau das funktioniert, schauen wir uns im nächsten Kapitel an.

In drei Sätzen

Was du jetzt weißt

Ein neuronales Netz ist eine grob vom Gehirn inspirierte Anordnung vieler einfacher Rechen-Einheiten (Neuronen), organisiert in Schichten. Eingabe, versteckte Schichten und Ausgabe.
Jedes Neuron gewichtet seine Eingaben und gibt ein Signal weiter; das gesamte "Wissen" eines Netzes steckt in diesen Gewichten, einer riesigen Liste von Zahlen.
"Deep Learning" heißt schlicht: viele Schichten. Tiefe Netze können aus einfachen Bausteinen schrittweise immer abstraktere Muster zusammensetzen, und sind die Grundlage moderner KI.