Как строить Low Latency-рекомендательный трансформер на миллион RPS / Всеволод Светлов (Яндекс)
Приглашаем на конференцию HighLoad 2024, которая пройдет 2 и 3 декабря в Москве!
Программа, подробности и билеты по ссылке:
--------
HighLoad Foundation 2022
Презентация и тезисы:
Я хочу рассказать о нашей модели пользовательских рекомендаций в рекламной сети Яндекса и некоторых проблемах, которые могут возникнуть при внедрении тяжелых нейросетевых моделей в высоконагруженный продакшн.
Примерный план доклада:
* высокоуровневое описание модели, для чего она нужна и как она работает;
* зачем мы разделили полноценный рекомендательный трансформер с early fusion-подходом на независимые части;
...
Нашли ошибку в видео? Пишите нам на support@
4 views
369
107
5 days ago 00:26:07 1
Строительные хитрости. Самый быстрый монтаж шпилек. Анкера DKC и многое другое.
5 days ago 00:01:01 1
Двигатель “выпрыгивает“ из-под капота при нажатии на газ? Появились вибрации при работе на холостых?
7 days ago 00:05:40 1
НАТО может спровоцировать конфликт в Прибалтике? Что подразумевают под угрозами в сторону России
2 weeks ago 00:00:58 1
Заменим только ремень ГРМ и хватит? Хватит так думать! #thepartsshow #avtovoprosby
2 weeks ago 00:13:19 2
Встречайте БАМ 3.0. Началась стройка, которая изменит Россию
2 weeks ago 00:04:39 1
Леонид Ивашов: Куда мы движемся и какой общественный строй формируется у нас !