Обработка данных с использованием Spark RDD, Spark SQL и Spark GraphFrames.
В видео я объясняю код к решению лабораторной работы по методам анализа больших объёмов данных. По заданию необходимо найти пользователя из РФ, чаще остальных упоминающего фамилии российских политических деятелей. Решение этого задания представлено в двух вариантах - на RDD и Spark SQL. Также нашёл наибольшую компоненту связности социального графа (группу пользователей, которые общаются преимущественно друг с другом) для иностранных/российских/московских пользователей с помощью Spark GraphFrames.
Ссылка на исходный код будет добавлена позже.
Ссылка на датасет:
0:00 Предварительные настройки
6:06 Spark SQL
8:48 Spark RDD
12:25 Spark GraphFrames
Предупреждение! Код в части Spark GraphFrames на моменте инициализации объекта GraphFrame при запуске на Google Colab выдаёт ошибку, на других платформах при правильной установке graphframes всё работает без ошибок.
1 view
678
265
6 years ago 00:31:32 72
Практический JS. Обработка данных формы
9 years ago 00:54:26 77
R язык программирования Обработка данных
9 years ago 02:04:30 153
4. Обработка пользовательских данных
4 years ago 00:00:00 23
“Обработка данных ДЗЗ“
3 years ago 00:07:06 27
Обработка данных аэрофотосъемки с БПЛА. TOPODRONE
4 years ago 00:18:27 62
Обработка данных сканирования Gexcel Heron Lite
1 year ago 00:09:39 153
9 класс. Паскаль. Обработка потока данных
1 year ago 00:40:33 30
Обработка данных лазерного сканирования в LiDAR360
8 years ago 00:05:24 29
Обработка данных МПВ
3 years ago 00:13:25 25
Binance API. Обработка данных на Python
4 years ago 00:02:02 23
Омавиат + Центр обработки данных CoreDataNet
4 years ago 00:05:24 24
Обработка данных. Новый мобильный сканер от Gexcel
5 years ago 00:14:24 84
Урок № 2. “Программная обработка данных на компьютере“
5 years ago 00:16:49 167
Уроки Arduino. Фильтры данных, обработка сигналов
4 years ago 00:08:16 18
2-6 MATLAB - Загрузка и обработка данных
9 years ago 01:15:04 130
Распределённая параллельная обработка данных технологией Map-Reduce
9 years ago 00:34:17 23
10 Обработка ошибок ввода данных
3 years ago 00:05:17 7
DYDX API. Обработка данных на Python
6 years ago 00:10:05 23
Изучение MongoDB / #8 - Моментальная обработка данных
5 years ago 00:07:53 9
Обработка статистических данных
13 years ago 00:06:47 67
Урок 6. Обработка данных | Clearasil и Caramba TV
7 years ago 02:33:06 182
Обработка и хранение персональных данных
7 years ago 00:18:22 136
Ювенальный Фашизм или что такое обработка персональных данных