Skip to content

arXiv führt einjähriges Verbot für Wissenschaftler ein, die ihre Arbeiten an LLMs übergeben

1 Min. Lesezeit
Teilen

arXiv, das größte offene Repositorium für wissenschaftliche Arbeiten vor der Begutachtung, hat endlich eine Linie gezogen. Ab sofort: Reicht ein Autor eine Arbeit ein, die offensichtlich zeigt, dass die Arbeit vollständig einem großen Sprachmodell überlassen wurde, folgt eine einjährige Sperre. Und das ist erst der Anfang. Nach der Sperre muss jede weitere Arbeit zuerst durch ein begutachtetes wissenschaftliches Journal, bevor sie auf arXiv erscheinen darf.

Die Plattform stand bereits unter Druck. Die Zahl minderwertiger, KI-generierter Arbeiten wächst von Monat zu Monat, und arXiv hatte zuvor schon die Regel eingeführt, dass neue Nutzer eine Empfehlung eines bekannten Autors brauchen. Nach 20 Jahren Hosting unter Cornell wird die Organisation jetzt eine unabhängige Non-Profit - das erlaubt ihr, Mittel speziell für den Kampf gegen KI-„Slop" zu sammeln.

Was zählt als "incontrovertible evidence"? Thomas Dietterich, Vorsitzender der Informatik-Sektion von arXiv, nennt zwei Fälle: halluzinierte Zitate (nicht existierende Referenzen) und Chat-Kommentare an oder von einem Sprachmodell, die versehentlich im Papier gelandet sind. Ein brutales Zeichen, dass der Autor seine eigene Einreichung nicht gelesen hat.

Wichtig ist, was arXiv nicht verbietet - nicht den Einsatz von LLMs. Dietterich ist präzise: Autoren müssen "volle Verantwortung" für den Inhalt übernehmen, "unabhängig davon, wie er erzeugt wurde". Kopiert ein Forscher ungenauen Text, plagiierten Inhalt, Fehler oder erfundene Quellen direkt aus Chat-GPT - es bleibt seine Verantwortung. Das Werkzeug ist kein Alibi.

Das System läuft nach dem "Ein-Schlag"-Prinzip. Moderatoren markieren verdächtige Arbeiten, Sektionsleiter müssen die Beweise bestätigen, bevor eine Strafe verhängt wird, und der Autor hat Einspruchsrecht. Das Verfahren ist scharf, aber nicht voreingenommen - Ordnung in einem bisher ungeregelten Raum.

Die Frage für den Leser: Kann eine einzelne Institution Qualitätsstandards halten, wenn Technologie das Schummeln billig macht? Dieser Ansatz ist das kleine Äquivalent dessen, was Europa auf regulatorischer Ebene tut - kein Verbot, sondern Verantwortlichkeit. Die Frage ist, ob es reicht, oder ob in ein bis zwei Jahren KI-generierte Arbeiten weiter erscheinen, nur besser versteckt.