Тёмный

Spark SQL - для работы с большими данными. Школа Больших Данных г. Москва 

Школа Больших Данных
Подписаться 6 тыс.
Просмотров 4,2 тыс.
50% 1

В данном видео рассматривается тема испольхования феймворка Apache Spark на примере модуля Spark SQL для анализа больших данных. В практическом примере мы увидим преимущества использования Spark SQL при выполнении запросов к данным.
Практическое использование TensorFlow API для сегментирования изображений объектов с которым вы можете познакомиться на курсах по Машинному обучению в нашем учебном центре «Школа Больших Данных».
Новый 3х дневный практический курс по основам машинного обучения для специалистов по аналитике данных, разработчиков и руководителей, которые хотят освоить базовые понятия Machine Learning с использованием Python. "Школа Больших Данных" г. Москва
По вопросам обучения на курсах машинного обучения приглашаем в нашу «Школа Больших Данных»
Обращаться по телефону:
+7 (495) 41-41-121
+7 (995) 100-45-63
Чтобы не пропустить информацию о новых курсах, акциях и других событиях Школы Больших Данных, рекомендуем подписаться на нас в социальных сетях:
Телеграм-канал: t.me/BigDataSchool_ru
Facebook: / bigdataschoolru
Вконтакте: bdschool_mck
LinkedIn: / bigdataschoolru
Twitter: / bigdataschoolr
Подписывайтесь и будьте в курсе всех интересных новинок мира Big Data вместе со Школой больших данных - www.bigdataschool.ru
Программа курса «Анализ данных с Apache Spark Streaming, Spark SQL и GraphX»
Экосистема Apache Spark - Spark RDD
Архитектура Spark. Принципы работы Resilent Data Distribution (Spark RDD)
Обзор компонентов Spark и их назначения
Конфигурация Spark из Java. Запуск на одной или нескольких машинах. Запуск поверх hadoop
Основные классы и базовый workflow - Spark RDD
Spark core - работа с аккумуляторами и переменными среды
Apache Spark SQL
Расширение базовой системы классов- DataSet и DataFrame
Получение данных из SQL-источников с помощью Spark SQL
Отправка данных в SQL СУБД и работа с Hive QL
Spark SQL и Hadoop
Планы выполнения. Logical и physical планы. Настройки планов выполнения
Spark Streaming
Разница работы в режимах OLAP и OLTP. Основной workflow
Виды Spark Stream-ов. Особенности исполнения streaming кода
Windows в Spark Streaming
Кеширование в Spark Streaming
Checkpoint-ы в Spark Streaming
GraphX
Задачи графов в программировании. Место графов в модели распределенных вычислений
Представление графов в GraphX. Создание графов
Операции с графами в GraphX
Выбор модели распределения графа в GraphX

Опубликовано:

 

29 мар 2020

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 1   
@hsqlk
@hsqlk Месяц назад
А почему не привели пример pandas? Он не очень с большими данными, но здесь и не так много
Далее
Что такое Apache Spark
16:20
Просмотров 16 тыс.
3M❤️ #thankyou #shorts
00:16
Просмотров 7 млн
Airflow на простом примере
9:53
Просмотров 1,4 тыс.