Research Insights Made Simple #6 - Interview with Nikolay Golov about data platforms
В этом выпуске подкаста про инсайты ко мне в гости пришел Николай Голов для того, чтобы обсудить то, как строить дата платформы в 2025 году:) Коля исполняет роль head of data engineering at ManyChat, а до этого он был head of data platform в Авито. Коля знает все о том как построить OLAP и OLTP системы, интенсивно работающие с данными.
За время подкаста мы обсудили темы
- Как развивалась карьера Коли в разных компаниях и как он стал преподавать базы данных параллельно с основной работой
- Как можно строить платформы данных (централизованно, гибридно и децентрализованно)
- Как выглядят принципы федерализации данных (аля data mesh) в теории
- Во что этот подход превращается на практике
- Как строить дата платформы в стартапах, средних, а также крупных компаниях в 2025 году
- Что не так с классическими базами данных (Postgres и иже с ним)
- Что не так с MPP базами данных (Vertica, Greenplum, ClickHouse, ...)
- Как data mesh превращается в data mash и как цепочки дата продуктов работают на практике
- Как выделять базовый домен данных, чтобы уменьшить длину цепочек дата продуктов
- Почему облачные аналитические базы так быстры: колоночное хранение разделение storage и compute
- Что такое medalion architecture
- Куда дальше будут развиваться технологии обработки данных и почему нельзя полагаться на старые подходы и ограничения
Дополнительные материалы
- Статья из периода работы в Avito “Vertica Anchor Modeling = запусти рост своей грибницы“ -
- Статьи из периода работы в Manychat и
- Запись “Data Modeling Meetup Munich: From Data Vault to Anchor Modeling with Nikolai Golov“ -
- Запись “DataVault / Anchor Modeling / Николай Голов“ -
- Научная статья “Golov N., Ronnback L., Big Data Normalization for Massively Parallel Processing Databases“ //Computer Standards & Interfaces, 09-May-2017,
- Научная статья “Golov N., Filatov A., Bruskin S.,Efficient Exact Algorithm for Count Distinct Problem“, Computer Algebra in Scientific Computing, July 2019
Timeline:
00:00 - Знакомство с гостем
01:52 - Карьера Коли и опыт преподавания курса по базам данных
03:28 - Централизованный подход к построению дата платформ
09:34 - Гибридный подход к построению дата платформ
12:20 - Децентрализованный подход к построению дата платформ (data mesh)
14:13 - Принципы федерализации управления данными
15:07 - Переход от виртуальных концепций к реальности
16:57 - Проблемы с автономностью в стартапах
20:07 - Аналитическая репликация
22:22 - Переход к MPP базам
26:21 - Ограничения MPP баз
28:53 - Проблемы с параллельным использованием баз данных
30:41 - Примеры из практики
32:30 - Организация данных в компаниях
37:50 - Проблемы критического пути (построение зависимых дата продуктов)
41:36 - Решение проблем с помощью введения базовых доменов для уменьшения критического пути
43:01 - Гибкая модель управления данными и проблемы, что она вызывает
48:02 - Проблемы с передачей данных между системами
50:48 - Преимущества разделения compute и storage в аналитических базах
54:24 - Современные форматы хранения данных (Apache Parquet)
56:16 - Разделение compute и storage в облаке
58:09 - Medallion Architecture
59:05 - Использование Snowflake
01:00:01 - Проблемы с запросами
01:02:48 - Будущее технологий
01:08:41 - Заключение
Нельзя полагаться на старые ограничения и подходы - важно выбирать оптимальные инструменты для текущих задач. Необходимо переосмысливать старые концепции и адаптироваться к новым условиям.
1 view
2389
880
15 hours ago 02:38:25 1
Research Insights Made Simple #7 - Interview with Pavel Lakosnikov about architecture governance
15 hours ago 01:11:05 1
Research Insights Made Simple #6 - Interview with Nikolay Golov about data platforms
15 hours ago 01:41:33 1
Research Insights Made Simple #5 “DORA Metrics, SPACE, DevEx, Human Approach to Dev Productivity“
15 hours ago 01:07:04 1
Research Insights Made Simple #4 - Обсуждение “AI-Enhanced API Design“
15 hours ago 01:03:15 1
Research Insights Made Simple #3 - Обсуждение “Secure by Design at Google“
15 hours ago 00:48:22 1
Research Insights Made Simple #2 - Обсуждение “Defining, measuring and managing technical debt“
15 hours ago 01:22:38 1
Research Insights Made Simple #1 - Обсуждение paper “API Governance at Scale“
19 hours ago 00:06:32 1
Best Forex Indicator : Why SmartCharts is a Game Changer in 2025!
19 hours ago 00:05:34 1
Crypto Trading for Beginners & Top Forex Trading Signals to Maximize Your Profits!
2 days ago 00:05:52 1
Bot Trading : Is CoinTech2U the Key to Financial Freedom?
2 days ago 00:13:31 1
Freemasonry: Historical Insights and Symbolic Meanings
2 days ago 00:19:28 1
16Personalities vs The Spiritual Seek - Personality Tests
2 days ago 00:13:26 1
Awakening the Soul: Exploring the Depths of Spiritual Consciousness
2 days ago 00:13:04 1
The Earthly World: An Illusory Reality and the Quest Within
2 days ago 00:14:36 1
Herd Mentality and Individual Psychology: From Wolf to Sheep and Vice Versa
2 days ago 00:12:05 1
The Enigma of Near-Death Experiences (NDEs): Scientific and Spiritual Interpretations
5 days ago 00:02:15 1
[IGN Movie Trailers] The Alien Perspective - Official Trailer (2025) Documentary
1 week ago 00:02:35 1
[CNBC Television] Under Armour reports mixed Q2 results
2 weeks ago 00:07:49 11
40 Facts About Sex You Never Knew | Human Psychology Behavior
2 weeks ago 00:07:40 1
Psychological Facts About Women That Will Surprise You | Human Psychology Behavior
2 weeks ago 01:43:14 6
Отчет: как донести инсайты из исследования до заказчика. Онлайн-митап
2 weeks ago 00:16:48 11
[Hearthstone Mathematics] New Best Decks to Reach Legend FAST! Consequences of Hearthstone Nerfs.
2 weeks ago 00:02:18 7
RIP Truther Thomas Goodrich Age 77
2 weeks ago 01:11:59 11
Karin McLeod Ph.D. UFO Hearings, Mantis ETs, Human Hybrids, New Abilities after ET Contact