Тёмный
No video :(

Михаил Благов - Эволюция схемы данных. Носим данные из реляционной СУБД в Hadoop 

SmartData
Подписаться 3,3 тыс.
Просмотров 567
50% 1

Ближайшая конференция - SmartData 2024, 4 сентября (online), 8-9 сентября, (Москва + трансляция).
Подробности и билеты: jrg.su/KFFBS7
- -
Скачать презентацию с сайта SmartData - jrg.su/FD7Epx
Знакома ли вам такая ситуация: построили замечательный ETL, витрины и красивые дашборды. На очередной отчетной встрече о работе вашей компании докладчик открывает дашборд, а там вместо графиков красные буквы (в лучше случае) или драматическое снижение ключевых показателей. Все охают, хватаются за сердце, а вы понимаете, что кто-то просто обновил продуктивную систему, не предупредив отдел отчетности... В докладе - про эволюцию схемы реляционных данных. Как не сломать downstream своими обновлениями, как защититься от ломающих обновлений в upstream системе. Стек: Hadoop, Spark. Форматы: Avro, Parquet, ORC. И немного про схемы и технологии их обновления.

Опубликовано:

 

28 авг 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 2   
@olegrozum4630
@olegrozum4630 2 месяца назад
elt on spark ? did you hear about informatica or similar products?
@olegrozum4630
@olegrozum4630 2 месяца назад
It's stupid to write etl with select * from table and then with a wise face prove different life hacks of consequences resolution 😂
Далее
what will you choose? #tiktok
00:14
Просмотров 7 млн
مسبح السرير #قصير
00:19
Просмотров 2,1 млн
Зачем нужны даталейки (Data Lake)
35:59
Что такое Hadoop за 10 минут
10:23
Просмотров 13 тыс.