Узнайте о новейших подходах к обработке данных на ApacheSpark от ведущих дата-инженеров.
Таймкоды:
00:00 - Вступление
23:37 - Эволюция ежедневного расчёта на 1 Пб данных: от ClickHouse к shuffle-free Spark
1:15:00 - Демократизация DQ-проверок в DataLakeHouse
2:15:00 - Использование оптимизаций Apache Spark. Storage-Partitioned Join и ее производные в регулярных ETL
613 views
9005
3353
9 months ago 01:14:27 1
МЫЛЬНЫЙ ПУЗЫРЬ ИИ. Разбираемся с Павлом Paperclip
1 year ago 01:13:34 1
«И жили они долго и счастливо» или История о том, как подружить Клиентский сервис и Продактов»
2 years ago 01:11:40 2
Счастье или опыт? Как работать с клиентами
2 years ago 00:16:13 1
BigData Team, курс Big Data / Machine Learning Engineer для Tech Orda 2023-2024 (расширенная версия)
2 years ago 00:27:44 1
Why Most Data Projects Fail & How to Avoid It • Jesse Anderson • GOTO 2023