QED Score für Preprints: Wie KI Qualität vor Review erkennt

Insights KI Neuigkeiten QED Score für Preprints: Wie KI Qualität vor Review erkennt

KI Neuigkeiten

01 Juli 2026

Read 8 min

QED Score für Preprints: Wie KI Qualität vor Review erkennt

QED Score für Preprints liefert früh belastbare Signale zu Originalität und Validität und spart Zeit.

Der QED Score für Preprints bewertet Originalität und Validität von Studien schon vor dem Peer Review. In einer Analyse von über 57.000 bioRxiv-Manuskripten half die KI, starke Arbeiten früh zu erkennen. Fachleute trafen in vielen Vergleichen dieselbe Wahl wie der Score, oft sogar gegen den späteren Journal-Rang. Forschende schultern Lehre, Labortermine und zusätzlich das Peer Review. Genau dort liegt der Engpass: Begutachtungen dauern, und vom Einreichen bis zur Veröffentlichung vergehen teils bis zu 18 Monate. Das Team um Oded Rechavi reagierte darauf mit QED, einem KI-Assistenten für Preprints. Mit dem QED Score für Preprints will das Team die Lücke zwischen Upload und klassischem Review schließen und frühe Qualitätssignale liefern.

QED Score für Preprints: Was misst die KI?

Blinde Bewertung von Originalität und Validität

Der QED Score für Preprints fokussiert auf zwei Kerndimensionen: Wie neu ist der Befund, und wie belastbar sind die Daten? Die Bewertung erfolgt blind gegenüber Autorinnen, Institutionen und Ländern – ein Plus angesichts bekannter Standort- und Gender-Bias im Peer Review. Zwischen Mai 2025 und April 2026 hat das Team 57.455 bioRxiv-Preprints gescort und so das oberste eine Prozent der Lebenswissenschaften identifiziert. QED wurde zuvor mit Community-Feedback geschärft: Die KI erkennt Neuheit, prüft einzelne Claims und markiert Lücken.

Neuheit: Einordnung des Beitrags zum bestehenden Wissen
Claims: Bewertung der Beweisführung pro Aussage
Lücken: Hinweise auf fehlende Kontrollen oder Daten

Ein Nebeneffekt: Würden Menschen selbst „nur“ oberflächlich prüfen, bräuchte es mehrere Reviewer und viele Stunden pro Manuskript – schnell summiert sich das zu Millionen Fachstunden.

Treffsicherheit im Vergleich zu Gutachter-Urteilen

Das Team validierte die Aussagekraft des Scores an knapp 5.000 Preprints; fast 3.000 davon erschienen später in Journals. Ergebnis: Eine positive Korrelation zwischen QED-Bewertung und dem eventualen Journal-Rang. In Paarvergleichen, bei denen ein Preprint einen hohen QED-Score, aber ein niedrigrangiges Journal hatte (und umgekehrt), wählten Expertinnen und Experten in rund 75 Prozent der Fälle die Arbeit mit dem höheren Score als qualitativ besser. Zudem sagte der Score den späteren Journalrang in nahezu 75 Prozent der Fälle korrekt voraus.

Wenn Score und Journal nicht übereinstimmen

Abweichungen blieben: Manche Arbeiten mit niedrigem Score landeten in hochrangigen Journals und umgekehrt. Genau hier zeigte der direkte Expertenvergleich seine Stärke, denn er entkoppelte die Qualitätswahrnehmung vom Journal-Label.

Ländervergleich: Volumen vs. Qualitätsspitze

Eine Auswertung der Top-ein-Prozent-Preprints ergab gemischte Bilder: Die USA veröffentlichten das größte Preprint-Volumen, während Österreich die meisten Beiträge mit den höchsten QED-Scores stellte.

Chancen und Grenzen eines KI-Scores

Pedro Beltrao betont: Wissenschaft hat viele Wertdimensionen, ein einzelner Kennwert misst nur einen Teil. Der QED Score für Preprints kann ein nützlicher Proxy sein, aber nicht die Basis für Karriereentscheidungen. Zugleich ist klar: Niemand kann alle neuen Studien lesen; Proxys sind unvermeidbar.

Kein Ersatz für Peer Review

Oded Rechavi stellt klar: QED und der Score sollen das Peer Review nicht ersetzen, sondern ergänzen – besonders dann, wenn Gutachten fehlen oder fehleranfällig sind. Die KI liefert eine erste, blinde Einschätzung und strukturiertes Feedback.

Transparente KI-Nutzung und menschliche Urteilskraft

Laut Sandhya Koushika zirkulieren bereits KI-erstellte Reviews. Besser ist offene Kennzeichnung – und, wenn schon KI, dann ein spezialisiertes, kostenloses Tool wie QED aus der Biologie für die Biowissenschaften. Zugleich mahnen Poonam Thakur und Bluma Lesch: Manche QED-Vorschläge sind praktisch nicht sofort umsetzbar. Deshalb bleibt menschliche Erfahrung zentral – gerade bei experimentellen Grenzen und Prioritäten.

Pro: schneller, blinder Qualitäts-Check; frühe Orientierung für Lesende und Autorinnen
Pro: oft bessere Übereinstimmung mit Expertinnen als mit Journal-Rang
Contra: ein Kennwert ist nie die ganze Wahrheit
Contra: Umsetzungsvorschläge teils unpraktisch; menschliche Prüfung nötig
Erforderlich: klare Regeln zur KI-Nutzung und Offenlegung in Reviews

Ausblick

Der Score ist nicht perfekt, aber laut Rechavi gut verbesserbar. Geplant sind weitere Iterationen und perspektivisch Einsätze jenseits der Lebenswissenschaften. Ein weiteres Signal aus den Daten: Qualitätsspitzen können aus unterschiedlichen Regionen kommen – Volumen allein erklärt sie nicht. Am Ende zählt: Der QED Score für Preprints bietet einen fairen, frühen Blick auf Originalität und Validität. Er kann Auswahl und Diskussion beschleunigen – doch Entscheidungen sollten Menschen treffen, mit Kontext, Praxiswissen und Verantwortung.

(Source: https://www.the-scientist.com/can-ai-tools-spot-great-science-before-reviewers-do-74677)

For more news: Click Here

FAQ

Q: Was ist der QED Score für Preprints? A: Der QED Score für Preprints ist eine KI-basierte Metrik, die die Originalität und Validität von Preprints bewertet, ohne Autoren, Institutionen oder Länder zu berücksichtigen. Er wurde aus blinden Bewertungen von über 57.000 bioRxiv-Manuskripten abgeleitet und soll frühe Qualitätssignale vor dem Peer Review liefern. Q: Welche Aspekte eines Preprints bewertet die KI? A: Der QED Score für Preprints konzentriert sich vor allem auf Neuheit, die Belegkraft einzelner Claims und das Aufdecken von Lücken wie fehlenden Kontrollen oder Daten. Die Bewertung erfolgt blind gegenüber Autorinnen, Institutionen und Ländern, um Standort‑ und Gender‑Bias zu verringern. Q: Wie wurde der QED Score für Preprints entwickelt und validiert? A: Das Team um Oded Rechavi verfeinerte QED mit Community‑Feedback und wertete 57.455 bioRxiv‑Preprints (Mai 2025–April 2026) mittels blinder Bewertungen aus, um den Score abzuleiten. Zur Validierung wurden knapp 5.000 Preprints geprüft, fast 3.000 davon erschienen später in Fachzeitschriften, und Expertinnen und Experten stimmten in etwa 75 % der Fälle mit dem QED Score für Preprints überein. Q: Wie gut sagt der QED Score für Preprints den späteren Journalrang voraus? A: Der QED Score für Preprints zeigte eine positive Korrelation mit dem eventualen Journalrang und sagte diesen in nahezu 75 % der Fälle korrekt voraus. Es blieben aber Ausnahmen, denn einige niedrig bewertete Preprints erschienen in hochrangigen Journals und umgekehrt, weshalb Expertenvergleiche weiter aufschlussreich sind. Q: Kann der QED Score für Preprints das Peer Review ersetzen? A: Nein, der QED Score für Preprints ist nicht als Ersatz gedacht, sondern soll das Peer Review ergänzen, insbesondere wenn Gutachten fehlen oder fehleranfällig sind. Menschliche Begutachtung bleibt notwendig, da die KI nicht alle Dimensionen abdeckt und manchmal unpraktische Experimente vorschlägt. Q: Welche Risiken und Grenzen gibt es beim Einsatz des QED Score für Preprints? A: Der QED Score für Preprints bildet vor allem eine Dimension wissenschaftlicher Qualität ab, daher ist er kein vollständiges Bewertungsinstrument und sollte nicht allein für Karriereentscheidungen verwendet werden. Außerdem fordern Forschende Transparenz und klare Regeln zur KI‑Nutzung, weil manche Bewertungen von QED von Journalrängen abweichen und Vorschläge nicht immer praktisch umsetzbar sind. Q: Wie sollten Forschende QED in der Praxis nutzen? A: Forschende können den QED Score für Preprints als frühe Orientierung und strukturiertes Feedback vor dem Einreichen zur Peer Review nutzen. Dabei sollte die Nutzung offen deklariert werden und menschliche Expertinnen und Experten die Umsetzbarkeit und Priorisierung der vorgeschlagenen Maßnahmen prüfen. Q: Welche Perspektiven und Weiterentwicklungen sind für den QED Score für Preprints geplant? A: Das Team plant weitere Iterationen des QED Score für Preprints und will die Methode weiter verbessern, unter anderem für Bereiche außerhalb der Lebenswissenschaften. Rechavi betont, dass KI‑Evaluierungen sich relativ leicht verfeinern lassen und künftig breiter einsetzbar sein könnten.