Какой pooling использовался при подсчете бенчмарка?

by DiTy - opened Apr 15, 2025

Apr 15, 2025

Пытаюсь воспроизвести бенчмарк Encodechka, пулю через CLS токен и получается сильно хуже чем значения в model card.
Подскажите, что юзали для пуллинга?

Заранее спасибо за ответ 🤗!

SpirinEgor

deep vk org Apr 15, 2025

Привет!

Мы использовали оригинальный репо и пример оттуда -- https://github.com/avidale/encodechka/blob/master/evaluation%20example.ipynb
Там происходит следующим образом:

Строятся эмбеды по CLS и Mean пулингу, а также их нормализованные версии
Поверх эмбедов обучается лог. рег или knn
Берется максимальное значение

Базово модель не обучалась на эмбеддинги, так что особо нет разницы какой пулинг обучать. Для RSG мы использовали AutoModelForSequenceClassification

DiTy changed discussion status to closed Apr 15, 2025

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment