Узнайте о новейших подходах к обработке данных на ApacheSpark от ведущих дата-инженеров.
Таймкоды:
00:00 - Вступление
23:37 - Эволюция ежедневного расчёта на 1 Пб данных: от ClickHouse к shuffle-free Spark
1:15:00 - Демократизация DQ-проверок в DataLakeHouse
2:15:00 - Использование оптимизаций Apache Spark. Storage-Partitioned Join и ее производные в регулярных ETL
608 views
9004
3352
2 years ago 00:16:13 1
BigData Team, курс Big Data / Machine Learning Engineer для Tech Orda 2023-2024 (расширенная версия)
4 years ago 00:44:59 4
Transfer learning and Transformer models (ML Tech Talks)
8 months ago 05:27:20 19
70 Leetcode problems in 5+ hours (every data structure) (full tutorial)
2 years ago 00:27:44 0
Why Most Data Projects Fail & How to Avoid It • Jesse Anderson • GOTO 2023
10 months ago 00:19:42 0
Firefox’s ad tech, CrowdStrike shenanigans, SecureBoot broken: Linux & Open Source News
3 years ago 01:58:21 15
#ЦМФ #Подкаст | Google | МГУ | Yandex | Kaggle | Leetcode | Python | С++ | Java | Go | Трансформеры