Пайплайн машинного обучения на Apache Spark / Павел Клеменков (Rambler&Co)
Приглашаем на конференцию HighLoad 2024, которая пройдет 2 и 3 декабря в Москве!
Программа, подробности и билеты по ссылке:
--------
Тезисы и презентация:
В докладе рассмотрим нашу старую архитектуру пайплайна машинного обучения, обратим внимание на ее недостатки как с точки зрения инфраструктуры и автоматизации, так и с точки зрения настройки моделей машинного обучения и проведения экспериментов. Разберемся с архитектурой Apache Spark, и почему мы решили его использовать. Подробно ознакомимся с новой архитектурой нашего пайплайна и тем, как она позволила оптимизировать обнаружение и устранение проблем, ускорила и упростила работу data scientist’ов по проведению экспериментов и доведения их до продакшена. Также затронем вопросы написания тестов и процесса разработки ПО на больших данных.
2 views
90
24
24 hours ago 00:59:38 760
Linguacodus — генерация кода из текстовых описаний задач машинного обучения (Екатерина Трофимова)
4 days ago 00:33:25 15
Круглый стол «Архитектура RISC-V – альтернативное и независимое будущее микропроцессоров»
3 weeks ago 00:14:56 72
#29 Интервью System Design в МосБиржу | Data Science | Machine Learning
1 month ago 00:23:47 1
Кузин Артур, X5 Retail Group, Москва - KAGGLЕ СОРЕВНОВАНИЯ ГУСИ, ПАЙПЛАЙНЫ, КУЛСТОРИ
1 month ago 00:41:07 2
Пайплайн машинного обучения на Apache Spark / Павел Клеменков (Rambler&Co)
1 month ago 00:41:21 2
Микросервисы для Machine Learning / Дмитрий Ходаков (Avito)
1 month ago 00:31:38 5
Доступность товара на полках / Артур Кузин (X5 Retail Group)
1 month ago 00:43:55 1
Версионирование дата-сетов и моделей машинного обучения / Дмитрий Петров ()