TMLR 2025

Maschinelles Lernen robuster gegenüber fehlerhaften Annotationen gestalten - Unsere neueste Arbeit in TMLR

Die zunehmende Verfügbarkeit vortrainierter, sogenannter Foundationmodelle hat neue Forschungsrichtungen für den Aufbau effizienter und erkl?rbarer maschineller Lernsysteme er?ffnet. In unserer neuesten Arbeit "An Embedding is Worth a Thousand Noisy Labels", die in der Zeitschrift Transactions on Machine Learning Research (TMLR) ver?ffentlicht wurde, stellen wir eine effiziente und dennoch leistungsf?hige Methode vor, um die sch?dlichen Auswirkungen fehlerhafter Annotationen durch eine neuartige, Foundationmodell-basierte Strategie zu reduzieren.

Weighted Adaptive Nearest Neighbour (WANN)

Wir pr?sentieren WANN (Weighted Adaptive Nearest Neighbor) eine trainingsfreie Methode, die Bildeinbettungen von Foundationmodellen in Kombination mit einem gewichteten k-NN-Ansatz verwendet, um die Robustheit der Klassifikation gegenüber fehlerhaften Annotation zu verbessern. Durch die Einführung einer Zuverl?ssigkeitsbewertung zur Beurteilung der Korrektheit der Annotationen w?hlt WANN adaptiv die Nachbarschaftsgr??e für jedes Testmuster aus und gewichtet die Vorhersagen basierend auf dieser Bewertung. Dies verbessert die Klassifizierungsleistung im Vergleich zu herk?mmlichen Methoden wie robusten Verlustfunktionen und festen k-NNs. Darüber hinaus ist WANN leichtgewichtig, interpretierbar, datenschutzfreundlich und kann effektiv auf verschiedene Datens?tze, Annotationsfehler und Bereiche wie das Gesundheitswesen verallgemeinert werden.

?ber TMLR

Transactions on Machine Learning Research (TMLR) ist eine neue Plattform für die Verbreitung von Forschungsergebnissen auf dem Gebiet des maschinellen Lernens, die das Journal of Machine Learning Research (JMLR) erg?nzen und gleichzeitig die noch unerfüllten Bedürfnisse der wachsenden ML-Gemeinschaft erfüllen soll.