Высокопроизводительный инференс глубоких сетей на GPU с помощью TensorRT / Максим Милаков (NVidia)
Приглашаем на конференцию HighLoad 2024, которая пройдет 2 и 3 декабря в Москве!
Программа, подробности и билеты по ссылке:
--------
Презентация и тезисы:
Производительность инференса - одна из самых серьезных проблем при внедрении DL приложений, так как она определяет, какое впечатление от сервиса останется у конечного пользователя, а также какова будет цена внедрения этого продукта. Таким образом, для инференса важно быть высокопроизводительным и энергоэффективным. TensorRT автоматически оптимизирует обученную нейронную сеть для максимальной производительности, обеспечивая существенное ускорение по сравнению с обычными часто используемыми фреймворками.
1 view
111
36
10 months ago 00:12:13 1
Lethal Company первая угар нарезка
5 years ago 00:00:10 13
Сервер на базе 8 Intel NUC
7 years ago 00:28:12 5
Максим Милаков, NVIDIA “Высокопроизводительный инференс глубоких сетей на GPU с помощью TensorRT“
8 years ago 00:36:30 1
Высокопроизводительный инференс глубоких сетей на GPU с помощью TensorRT / Максим Мил...