Тёмный

SQL Day 2023 - AZURE SYNAPSE ANALYTICS - OPTYMALIZACJA SPARK JOBS - Damian Widera 

Data Community Poland
Подписаться 3,1 тыс.
Просмотров 43
50% 1

W trakcie sesji chciałbym poruszyć zagadnienie optymalizacji Spark - dowiesz się, co to jest partycjonowanie, jaka jest różnica pomiędzy partycjami read, write, shuffle. Opowiem, jak zwiększyć zrównleglanie operacji i jaka powinna być odpowiedni rozmiar partycji i plików. Sprawdzimy, gdzie znajdują się dane w trakcie operacji shuffle. Odpowiem na pytanie, dlaczego zdarza się, że Spark job zwalnia, kiedy zostaje tylko kilka zadań do zakończenia i te zadania się nie kończą. No i na koniec - dlaczego dodawanie kolejnych węzłów do klastra nie zmniejsza czasu wykonywania zadań.

Опубликовано:

 

30 сен 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии    
Далее
Bearwolf - GODZILLA Пародия Beatrise
00:33
Просмотров 299 тыс.
11 ming dollarlik uzum
00:43
Просмотров 1,3 млн
Se las dejo ahí.
00:10
Просмотров 5 млн
Teeth gadget every dentist should have 😬
00:20
Просмотров 941 тыс.
Microservices with Databases can be challenging...
20:52
SQL Day 2023 - Otwarcie konferencji
33:57
Bearwolf - GODZILLA Пародия Beatrise
00:33
Просмотров 299 тыс.