30. Juni 2025
Artikel von Markus Flicke, Madhav Iyengar, Vitalii Protsenko, Illia Shakun, Jovan Cicvaric, Bora Kargi, Haoyu He, Lukas Schuler, Lewin Scholz, Kavyanjali Agnihotri, Yong Cao, Andreas Geiger

Scholar Inbox: Tägliche Paper-Empfehlungen nur für dich

Wissenschaftliches Wissen wächst heute schneller als je zuvor. Wie behält man da noch den Überblick? Scholar Inbox hilft Forschenden, immer einen Schritt voraus zu sein, indem es das Finden von Open-Access-Publikationen intelligenter und persönlicher gestaltet.

Wie behält man inmitten der täglichen Flut neu erscheinender Fachartikel den Überblick? Wahrscheinlich habt ihr auch schon mit Google-Scholar-Alerts gearbeitet – und schnell gemerkt, dass die Empfehlungen oft entweder redundant sind oder, schlimmer noch, man wichtige Paper verpasst, da sie außerhalb des eigenen Suchradius liegen. In der schnelllebigen Forschungslandschaft von heute können die Kosten für ein übersehenes Paper hoch sein: Man läuft Gefahr, von der Konkurrenz abgehängt zu werden, bereits veröffentlichte Ergebnisse mit der eigenen Forschung nur zu reproduzieren oder eine bahnbrechende Entdeckung schlicht zu übersehen.

Genau deshalb haben wir Scholar Inbox entwickelt, eine Plattform, die es ermöglicht, stets die neuesten Publikationen abzurufen – präzise zugeschnitten auf die eigenen Interessen.

Die Idee entstand ursprünglich als kleines Tool in unserer Arbeitsgruppe an der Universität Tübingen unter der Leitung von Prof. Andreas Geiger. Was als Nebenprojekt eines Masterstudenten begann, fand schnell begeisterte Anwenderinnen und Anwender innerhalb der Tübinger Forschungs-Community. Deren Feedback half uns, den Fokus auf das Wesentliche zu richten: Relevanz, Aktualität und angemessene thematische Breite. Heute nutzen Zehntausende Forschende weltweit Scholar Inbox und erhalten täglich personalisierte Updates aus dem gesamten Open-Access-Ökosystem – von arXiv über bioRxiv bis medRxiv und vielen weiteren.

Forschung, die euch findet

Stellt euch mal vor, die Fachartikel, die ihr benötigt, würden euch erreichen, noch bevor ihr überhaupt wüsstet, dass ihr sie braucht…

Als die Nutzerzahl auf Scholar Inbox in die Höhe schnellte, stand unser Entwicklungsteam vor der Herausforderung, aus dem nicht enden wollenden Strom hunderter neuer Paper pro Tag genau jene herauszufiltern, die wirklich relevant sind. Um dieses Problem zu lösen, haben wir ein personalisiertes Empfehlungssystem gebaut, das sich durch das Feedback der Nutzerinnen und Nutzer weiterentwickelt. Mit jeder Bewertung und Interaktion lernt das System und verfeinert so ständig sein Verständnis für eure Forschungsinteressen.

Anders als soziale Netzwerke, die Inhalte aufgrund ihrer Beliebtheit anzeigen, geht Scholar Inbox einen grundlegend anderen Weg. Unser System bewertet nicht, wie oft ein Paper bereits zitiert wurde oder wie bekannt die Autorin oder der Autor sind, sondern es analysiert die semantischen Merkmale jedes Dokuments. So vermeiden wir den Matthew-Effekt, bei dem Sichtbarkeit weitere Sichtbarkeit erzeugt – oft zulasten aufstrebender oder unterrepräsentierter Stimmen innerhalb der Wissenschaft. Bei Scholar Inbox zählt allein die Relevanz für die eigene Forschung.

Je mehr Menschen die Plattform nutzen, umso besser funktioniert sie: Anhand der Interaktionen unserer Nutzerinnen und Nutzer können wir aktuelle Trends und Veröffentlichungen disziplinübergreifend hervorheben, ohne die persönlichen Präferenzen dabei aus dem Blick zu verlieren.

Scholar Inbox bietet wichtige Tools für Forschende: Personalisierte Artikelempfehlungen, interaktive Wissenschaftskarten zur Erforschung verschiedener Fachgebiete, intelligente Artikelsammlungen, Suchfunktionen zur Unterstützung von Literaturrecherchen sowie einen Konferenzplaner zur Zeitoptimierung bei Postersessions und Vorträgen.

Wissenschaftliche Erkenntnis beschleunigen und demokratisieren

Wir von Scholar Inbox sind davon überzeugt, dass wissenschaftliches Wissen für alle frei zugänglich sein sollte. Doch wichtige Entdeckungen werden heute oft von den Verlagen hinter Bezahlschranken zurückgehalten. Wir finden nicht nur, dass Open Access praktischer ist, sondern eine Notwendigkeit für gerechten Fortschritt.

Indem wir uns ausschließlich auf frei verfügbare Publikationen konzentrieren, ermöglichen wir Forschenden weltweit, unabhängig von institutionellen Abonnements stets auf dem Laufenden zu bleiben. Unser Empfehlungssystem zeigt wichtige Arbeiten unmittelbar nach ihrer Veröffentlichung an, in den meisten Fällen sogar noch vor dem Peer Review, sodass vielversprechende Ideen nicht monatelang auf ihre Leserschaft warten müssen.

So funktioniert unser Empfehlungsalgorithmus

Kernstück von Scholar Inbox ist ein System, das Empfehlungen aufgrund von Nutzerinteraktionen ausspricht. Um den semantischen Gehalt von wissenschaftlichen Fachartikeln zu erfassen, setzen wir einen transformerbasierten Encoder (GTE) ein, der jedes Paper in einen hochdimensionalen Vektor überführt. Diese „Embeddings“ erlauben den direkten inhaltlichen Vergleich der Fachartikel statt bloßer Schlagwortabgleiche oder Auswertungen von Zitierzahlen.

Aktuell liegen Vektoren für über drei Millionen Dokumente in unserer Datenbank vor – inklusive aller Neuzugänge bei arXiv, bioRxiv, medRxiv, ChemRxiv und Beiträgen renommierter Konferenzen. Für jede Nutzerin und jeden Nutzer wird ein individuelles Klassifikationsmodell trainiert, das zwischen positiv und negativ bewerteten Artikeln unterscheidet. Herausfordernd dabei ist, dass negatives Feedback sich oft auf Paper bezieht, die den Nutzerinnen und Nutzern von Scholar Inbox empfohlen wurden – das heißt, dass die Paper bereits semantisch nahe an deren persönlichen Interessen liegen. Deshalb arbeiten wir zusätzlich mit „einfachen“ Negativbeispielen – zufällig ausgewählten Arbeiten aus dem Gesamtbestand – um dem Modell dabei zu helfen, sowohl einfache als auch schwierige negative Samples als Entscheidungsgrenze zu berücksichtigen.

Da Nutzerinnen und Nutzer mit unterschiedlich vielen Fachartikeln interagieren – dies oft mit unbalancierten Labels – arbeiten wir mit einer gewichteten Verlustfunktion, welche die ungleiche Verteilung von Feedback ausgleichen soll. So lernt das System, welche Inhalte für die Nutzenden wirklich relevant sind. Eine detaillierte Beschreibung, wie wir das Empfehlungssystem trainieren und welche Designentscheidungen für genaue Empfehlungen wichtig sind, findet ihr in unserem Paper.

Das Ergebnis? Ein System, das sich an die Lesepräferenzen der Nutzerinnen und Nutzer anpasst, um ihnen präzise, personalisierte Empfehlungen zu liefern. Sie erhalten einen personalisierten Digest, der täglich die relevantesten Paper aus über 1000 neu veröffentlichten Fachartikeln auflistet. Dieser Digest kann so angepasst werden, dass auch längere Zeiträume bei der Auswahl berücksichtigt werden können oder die Nutzerinnen und Nutzer per E-Mail über neue Artikel informiert werden.

Die Wissenschaftswelt als Landkarte

Warum nicht durch die Forschung navigieren wie auf einer Landkarte – statt endlos durch einen Feed zu scrollen?

Mit Scholar Maps haben wir eine interaktive, zweidimensionale Visualisierung von wissenschaftlicher Literatur entwickelt, die alle Bereiche der Wissenschaft abdeckt. Mithilfe von t-SNE-Projektionen von semantischen Embeddings für über drei Millionen Artikel stellen wir die Struktur der Wissenschaft als navigierbare Landschaft dar. Artikel, die semantisch ähnlich sind, werden nahe beieinander positioniert und bilden organische Cluster, die reale Forschungsgemeinschaften und -themen widerspiegeln.

Eine Karte ist jedoch nur dann nützlich, wenn man sie lesen und mit ihr navigieren kann. Mithilfe großer Sprachmodelle und etablierter wissenschaftlicher Taxonomien werden Cluster wissenschaftlicher Arbeiten hierarchisch gekennzeichnet. Wenn man hineinzoomt, werden dynamisch weitere Details geladen, ähnlich wie in Google Maps.

Wir sind überzeugt, dass Scholar Maps weit mehr als nur ein Kuriosum ist: Es könnte die Art und Weise, wie wir neue Forschung und wissenschaftliche Publikationen in Zukunft entdecken, grundlegend verändern. Für alle, die Scholar Maps testen wollen ohne sich zu registrieren, ist eine öffentliche Demo verfügbar unter www.scholar-maps.com.

Eure persönliche Bibliothek und Konferenzplaner

Doch das ist noch nicht alles. Damit ihr euch auf eure Hauptinteressen konzentrieren und den administrativen Aufwand minimieren könnt, haben wir Scholar Inbox um weitere Funktionen erweitert. Eure Literaturrecherche zu organisieren, ist jetzt nicht nur einfacher, sondern auch intelligenter. In Scholar Inbox können Nutzerinnen und Nutzer Sammlungen erstellen, um Artikel zu bestimmten Forschungsthemen oder Projekten unter bestimmten Schlagworten zusammenzufassen. Unser Empfehlungssystem schlägt automatisch weitere Artikel vor, die der semantischen Signatur einer Sammlung entsprechen, sodass ihr euer Verständnis eines Themas anhand weniger Ausgangspunkte erweitern könnt.

Sich auf großen wissenschaftlichen Konferenzen zurechtzufinden, kann überwältigend sein. Unser personalisierter Konferenzplaner hilft Forschenden, den Überblick zu behalten. In enger Zusammenarbeit mit den Organisationsteams von Konferenzen können wir strukturierte Zeitpläne erstellen, die auf jede Teilnehmerin und auf jeden Teilnehmer zugeschnitten sind. Basierend auf euren Interessen priorisiert unser System die relevantesten Poster und Vorträge und hilft euch so, eure Zeit effektiv zu nutzen. Diese Funktion wurde bereits bei einigen der größten Konferenzen in der Informatik eingesetzt, darunter CVPR, NeurIPS, ECCV, ICML und ICLR. Zukünftig wollen wir diese Funktion auch für Konferenzen anderer Disziplinen anbieten. Falls ihr selbst eine große Konferenz organisiert, kommt gern auf uns zu – wir freuen uns darauf, mit euch zusammenzuarbeiten!

Werdet Teil der Scholar Inbox-Community

Scholar Inbox ist mehr als ein Tool: Es ist eine wachsende Gemeinschaft von Forschenden, die sich für Open Source, bahnbrechende wissenschaftliche Entdeckungen und freien Wissensaustausch starkmachen. Unsere Plattform ermöglicht es Wissenschaftlerinnen und Wissenschaftlern, neugierig und informiert zu bleiben und sich über ihre Disziplinen hinweg zu vernetzen.

Ganz gleich, ob ihr am Anfang eurer akademischen Laufbahn steht oder eine Forschungsgruppe leitet, wir laden euch herzlich ein, Teil unserer Graswurzelbewegung zu werden. Probiert die Plattform aus, entdeckt neue Fachgebiete und teilt uns eure Verbesserungsvorschläge mit. Das Feedback aus der Scholar Inbox Community hilft uns dabei, noch besser zu werden.

Originalpublikation: Markus Flicke, Glenn Angrabeit, Madhav Iyengar, Vitalii Protsenko, Illia Shakun, Jovan Cicvaric, Bora Kargi, Haoyu He, Lukas Schuler, Lewin Scholz, Kavyanjali Agnihotri, Yong Cao, Andreas Geiger. 2025. Scholar Inbox: Personalized Paper Recommendations for Scientists. In Proceedings of the 63nd Annual Meeting of the Association for Computational Linguistics (Volume 3: System Demonstrations), Vienna, Austria. Association for Computational Linguistics. https://doi.org/10.48550/arXiv.2504.08385

Titelillustration: Franz-Georg Stämmele

Übersetzung ins Deutsche: Fortuna Communication

Kommentare

Ich habe die Datenschutzerklärung zur Kenntnis genommen.
Neueste Forschung
3. April 2025 Jennifer Raffler/ Podcast-Team "Key To My Research"

Wie KI unseren Alltag prägt

Ob ChatGPT an der Uni oder virtuelle Holocaust-Zeitzeugnisse im Museum – KI verändert, wie wir lernen, forschen und erinnern. Der Kulturwissenschaftler Christoph Bareither untersucht diese Entwicklungen. Im Podcast „Key To My Research“ gibt er Einblicke in seine Arbeit.
Neueste Forschung
18. April 2024 Rita González-Márquez

20 Millionen Papers gleichzeitig durchforsten und neues Wissen freilegen

In der Biomedizin und den Lebenswissenschaften werden jedes Jahr mehr als eine Million Papers veröffentlicht - eine überwältigende Menge. Um die Orientierung in der Literatur zu erleichtern, haben wir mit Hilfe von maschinellem Lernen eine Karte der gesamten biomedizinischen Forschungslandschaft in Form einer interaktiven Webseite erstellt. Sie macht es möglich, 20 Millionen Veröffentlichungen gleichzeitig zu durchsuchen und Schnittmengen zwischen ihnen zu erkennen.