ZAIOS.NETBlogForschung & Zukunft
19. März 2026 2 Min. Lesezeit

ICML 2026: KI im Peer-Review – 497 Einreichungen desk-rejected

Die KI-Konferenz ICML hat 2% aller Einreichungen abgelehnt, weil Gutachter verbotenerweise LLMs für ihre Reviews nutzten.

Die International Conference on Machine Learning (ICML) gilt als eine der renommiertesten wissenschaftlichen Konferenzen im Bereich der Künstlichen Intelligenz. Umso pikanter ist eine Entwicklung, die die Programmverantwortlichen der ICML 2026 nun öffentlich gemacht haben: Insgesamt 497 eingereichte Arbeiten – rund zwei Prozent aller Einreichungen – wurden sogenannten Desk-Rejections unterzogen. Der Grund: Die jeweils zugewiesenen Gutachter hatten bei der Erstellung ihrer Reviews gegen die expliziten Regeln zum Einsatz von Large Language Models (LLMs) verstoßen.

Was genau ist passiert?

Im Peer-Review-Prozess wissenschaftlicher Konferenzen werden eingereichte Arbeiten von Fachkolleginnen und -kollegen bewertet, bevor über eine Annahme oder Ablehnung entschieden wird. Die ICML hatte für das Jahr 2026 klare Richtlinien erlassen, die den unkontrollierten Einsatz von KI-Werkzeugen wie ChatGPT oder ähnlichen Sprachmodellen bei der Erstellung dieser Gutachten ausdrücklich untersagen. Hintergrund ist die Sorge, dass automatisch generierte Reviews die wissenschaftliche Integrität des Verfahrens untergraben – schließlich soll ein Gutachten die kritische, fachkundige Auseinandersetzung eines menschlichen Experten widerspiegeln.

Die Konferenzverantwortlichen, darunter Program Chairs wie Alekh Agarwal und Sharon Li sowie Scientific Integrity Chair Nihar B. Shah, identifizierten insgesamt 506 sogenannte „reciprocal reviewer", die gegen diese Vorgaben verstoßen hatten. Als Konsequenz wurden alle Einreichungen, die diesen Gutachtern zugewiesen worden waren, ohne inhaltliche Prüfung abgelehnt – eine drastische, aber aus Sicht der Veranstalter notwendige Maßnahme zum Schutz der Verfahrensintegrität.

Ein strukturelles Problem der KI-Forschungsgemeinschaft

Der Vorfall wirft ein Schlaglicht auf ein grundlegendes Dilemma, mit dem die gesamte wissenschaftliche Community konfrontiert ist: Ausgerechnet jene Forscher, die KI-Systeme entwickeln und erforschen, sind auch diejenigen, die am leichtesten auf diese Werkzeuge zugreifen – und offenbar auch am ehesten versucht sind, sie einzusetzen, selbst wenn es gegen geltende Regeln verstößt. Der Einsatz von LLMs zur Beschleunigung von Routineaufgaben ist in der Forschungspraxis längst weit verbreitet. Die Grenze zwischen zulässiger Nutzung – etwa zur Textüberarbeitung oder Literaturrecherche – und unzulässiger Substitution echter Fachkompetenz ist dabei fließend und schwer zu kontrollieren.

Andere große Konferenzen wie NeurIPS oder ICLR stehen vor denselben Herausforderungen und haben ebenfalls entsprechende Richtlinien eingeführt. Die ICML geht mit ihrer konsequenten Durchsetzung und der öffentlichen Kommunikation des Vorfalls jedoch einen besonders transparenten Weg – und setzt damit ein deutliches Signal an die Community.

Was bedeutet das für betroffene Autoren?

Für die Autorinnen und Autoren der 497 abgelehnten Arbeiten ist die Situation besonders frustrierend: Sie tragen keine persönliche Schuld an dem Regelverstoß, sind aber dennoch von den Konsequenzen direkt betroffen. Ihre Einreichungen wurden nicht inhaltlich bewertet, sondern allein wegen des Fehlverhaltens ihrer Gutachter zurückgewiesen. Ob und in welcher Form eine Möglichkeit zur erneuten Einreichung oder ein Einspruchsverfahren vorgesehen ist, bleibt abzuwarten.

Der Fall macht deutlich: Mit dem rasanten Einzug von KI-Werkzeugen in den wissenschaftlichen Alltag müssen Konferenzen und Fachzeitschriften nicht nur Regeln aufstellen, sondern auch die technischen und organisatorischen Mittel entwickeln, um deren Einhaltung zuverlässig zu überprüfen. Das ist eine der zentralen Herausforderungen für die Integrität wissenschaftlicher Kommunikation in den kommenden Jahren.

Quellen: Hacker News

science-techllmki