Welt der Maschinen: Wie KI das menschliche Web frisst

Gabriela hat 16 Jahre lang die Welt bereist. 150 Länder. Sie hat Orte besucht, die kaum jemand kennt, und darüber geschrieben – aus erster Hand, mit eigenem Erleben. Ihr Bericht über Somaliland als alleinreisende Frau ist der einzige seiner Art im gesamten Internet. Tippt man „solo female travel in Somaliland“ in die klassische Google-Suche, erscheint ihr Blog als erster Treffer.

Google AI Search zeigt stattdessen eine kommerzielle App mit einem generischen SEO-Absatz. Kein Erlebnis. Keine Geschichte. Nur Text, der so klingt, als hätte ihn jemand geschrieben, der Somaliland aus der Distanz einer Datenbank kennt.

Das ist kein Einzelfall. Das ist das System.


Ein Vertrag wird gebrochen

Das frühe Web funktionierte nach einem einfachen, stillen Vertrag: Du produzierst Inhalte. Andere finden sie über Suchmaschinen. Du bekommst Aufmerksamkeit, vielleicht Einnahmen, zumindest das Gefühl, dass deine Arbeit etwas bewegt. Dieser Vertrag hat funktioniert – nicht perfekt, aber erkennbar.

KI-Suche bricht diesen Vertrag einseitig auf.

Die Maschine liest Gabrielas Bericht. Sie destilliert ihn. Sie antwortet dem nächsten Suchenden mit einer Zusammenfassung – und Gabriela bekommt keinen Klick, keine Sichtbarkeit, keinen Dank. Ihr Inhalt ist eingeflossen, aber ihr Name taucht bestenfalls als fünfte Quellenangabe hinter Booking.com auf. Meistens gar nicht.

„Sie empfiehlt mir sogar ein bestimmtes Hotel“, schreibt Gabriela, „und verlinkt dabei auf eine Buchungsplattform. Als ich nach der Quelle frage, nennt die KI dann meinen Blog. Die Empfehlung war meine – aber der Traffic geht woanders hin.“


Die Qualität geht mit den Menschen

Man könnte sagen: Gut, das ist der Fortschritt. Inhalte werden effizienter verteilt. Aber das stimmt nicht einmal auf der technischen Ebene.

Was KI-Suche bevorzugt, sind nicht die besten Quellen. Es sind die optimierten. Große kommerzielle Seiten mit SEO-Budget, generische Landingpages, die jedes Keyword bedienen ohne einen einzigen Satz echter Erfahrung zu enthalten. Die Algorithmen wurden jahrelang auf Signale wie Domain-Autorität und Linkstruktur trainiert – und diese Signale bevorzugen Größe über Qualität.

Das Ergebnis: Wenn man die KI nach dem einzigen echten Erfahrungsbericht über Somaliland fragt, halluziniert sie zunächst zwei Bloggerinnen. Eine davon ist ein Mann. Die andere existiert nicht mehr. Erst nach mehrfachem Nachfragen gesteht die KI, dass sie sich die Quellen ausgedacht hat – und nennt dann Gabrielas Blog.

Das Web wird durch diesen Prozess nicht besser zusammengefasst. Es wird durch schlechtere Inhalte ersetzt.


Was im Trainingsmaterial steckt

Ich selbst habe das erlebt, auf andere Weise.

In den späten 1990er Jahren, als das Web noch laufen lernte, schrieb ich JavaScript-Snippets. Kleine Werkzeuge – darunter eines namens quickwindow, das einen schwebenden Infotext beim Überfahren eines Links öffnete. Was heute jeder <div> mit ein paar CSS-Zeilen erledigt, brauchte damals fünfzig Zeilen Code. Und weil das damals so war, wurden Autoren genannt. Im Kommentar-Header jedes Scripts stand eine E-Mail-Adresse:

 
 
// Author: schiller@muenchen.org
// Feel free to use, but keep this credit

Dieser Header wanderte mit dem Script. Auf Hunderte von Seiten. Es war kein Lizenzrecht – es war Ehrencode. Und er hat funktioniert.

Diese Seiten existieren längst nicht mehr. Aber KI-Systeme wurden mit Snapshots des Webs trainiert, bevor es vergessen hat. Die Adresse schiller@muenchen.org, die Kennung bm596269 – sie tauchen in Trainingsdaten auf, die niemand mehr im offenen Web findet. Das Modell hat sie eingefroren. Es weiß nicht, dass ich und diese Strings dieselbe Person sind.

Das ist die eigenartige Stille dieser Situation: Man erkennt sich selbst im Material, aber die Maschine erkennt einen nicht zurück.


Das Recht auf Vergessen greift nicht

Die DSGVO gibt Menschen das Recht, aus Datenbanken gelöscht zu werden. Aber KI-Modelle sind keine Datenbanken. Die Trainingsdaten sind nicht als Datei gespeichert – sie sind als statistische Muster über Milliarden Parameter verteilt. Es gibt keine Zeile, die man löschen könnte. Kein Unternehmen könnte technisch nachweisen, was genau wie stark in einem Modell vertreten ist.

Das „Right to be Forgotten“ existiert auf dem Papier. In der Realität dieser Systeme ist es wirkungslos.


Die Oberfläche ist glatt

90 Prozent der Nutzer bemerken das nicht. Nicht weil sie dumm sind – sondern weil die Oberfläche es so eingerichtet ist.

Die KI antwortet selbstsicher. Das grüne Schloss im Browser suggeriert Sicherheit. Cookie-Banner sind so gestaltet, dass Ablehnen fünf Klicks kostet und Zustimmen einen. Wer nie das frühe Web erlebt hat, hat keinen Vergleichspunkt. Für sie ist das einfach, wie das Internet ist.

Dabei passiert gerade etwas Grundlegendes: Das Web wurde von Menschen gebaut – von Gabrielas, von Nicks mit seinen Inselführern, von Audrey die heute Bewerbungen schreibt weil sie 98 Prozent ihres Traffics verloren hat, von Entwicklern die ihre E-Mail-Adresse in Kommentarheader schrieben weil das die Art war, wie man sich erkannte.

Dieses menschliche Web wird gerade systematisch eingesammelt, destilliert und durch etwas ersetzt, das generischer ist, mittelmäßiger, aber in industrieller Menge produzierbar.


Was bleibt

Das frühe Web hatte etwas Schwer-zu-Benennendes: Handschrift. Man konnte spüren, dass ein Mensch dahinter steckte.

schiller@muenchen.org im Header eines Scripts ist mehr Identität als jeder verifizierte Account heute. Gabrielas Somaliland-Bericht ist mehr Wissen als jede SEO-Landingpage. Rajivas Gästebuch, erreichbar nur noch hinter einem abgelaufenen SSL-Zertifikat, ist mehr Geschichte als alles, was ein Algorithmus je über München schreiben wird.

Diese Dinge verschwinden nicht laut. Sie verrotten still – hinter Sicherheitsfehlern, hinter Klick-Optimierungen, hinter Antworten die gut klingen aber halluziniert sind.

Die Welt der Maschinen ersetzt das nicht. Sie vergisst es nur schneller.

Kommentar hinterlassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert