Тёмный

ETL на airflow - Курсы "Школы Больших Данных" г. Москва 

Школа Больших Данных
Подписаться 7 тыс.
Просмотров 19 тыс.
50% 1

Опубликовано:

 

30 сен 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 32   
@ДмитрийКоролев-ч8ь
Большое спасибо! А у вас есть уроки, где аписано взаимодействие Spark и Airflow?
@ШколауправленияипродажКоммерса
Здравствуйте, Благодарим за комментарий. Такого видео нет, есть тема для дальнейшей работы. Предложим преподавателям записать видео на эту тему.
@ДмитрийКоролев-ч8ь
@@ШколауправленияипродажКоммерса Лучшие!
@КонстантинКолоколов-ъ8г
Интересный момент, когда мы пушим данные по ключу в xcom, то получить мы их можем в другой таске по индексу [0]. Когда же в функции мы используем return json_data, которая также пушить в xcom, то в указании индекса нет нужды.По ключу данные попадают в xcom в виде списка[ ], внутри которого кортеж( ) и распаковываются в следующем таске по индексу, а во втором случае сразу в виде кортежа. В аргументах оператора также нужно указать provide_context=True.
@hhdushaa
@hhdushaa 2 года назад
{ "data": { "error": [ {"msg": "API key has been disabled." } ] }} Первый таск не выполнился хотя и пометился Success, и лучше бы response 200 обернуть эксепшаном) спасибо за то, что дали почувствовать себя занудой ))) В целом ломается понятно!
@dblmok_
@dblmok_ 2 года назад
Вам нужен корректный токен
@basil0607
@basil0607 2 года назад
5:34 Вот интересно, вы получите ответ от API на 10 Гб, вы его тоже станете пихать в метаданные? Или всё-таки сложите данные в файл на файловую систему или даже в базу озера данных в том же таске, в котором получили?
@dblmok_
@dblmok_ 2 года назад
Как правило по сети не ходят 10 гб… если это почему то так, то это архитектурная ошибка. Отвечая на ваш вопрос: большие объемы данных ходят через бд
@letronas
@letronas Год назад
вообще в принципе не рекомендуется использовать XCOM просто потому что он ограничен и мы занимаем боевую базу airflow. Обмены, действительно, стоит делать через что-то стороннее. В книге видел примеры и через файлы и через базы данных.
@yaroslavsolntsev9909
@yaroslavsolntsev9909 7 месяцев назад
Разумеется нужно контролировать что лезет из API. При таких объемах риск обырвалга порядком выше. А в купе с рекомендацией ложить промежуточные данные во внешнюю стабильную среду есть более правильно, ибо упасть может все, а промежуточные данные всегда под рукой в папочке или бэкапятся еще куда-нить в облачко.)
@dmitrylemeshenko9642
@dmitrylemeshenko9642 Год назад
Спасибо
@namefamily3279
@namefamily3279 2 года назад
Спасибо!
@romankonovalov2588
@romankonovalov2588 4 месяца назад
Топ
@PizdaRusni2023
@PizdaRusni2023 3 года назад
ti - кто он? что? Какой тип? Что вообще приходит в кваргс? разве так сложно все разложить по полочкам. А то получається "возьмем что то не знаю что и выполним команду для чего то..." Напишите док стринги со всем что прилетает или с основными параметрами.
@PizdaRusni2023
@PizdaRusni2023 3 года назад
ti: airflow.models.taskinstance.TaskInstance
@dblmok_
@dblmok_ 3 года назад
Добрый день! Спасибо за рекомендации. Действительно, не к каждой переменной в видео указан ее тип. Формат видео не позволяет настолько подробно углубляться в содержание.
@iexploiter
@iexploiter 3 года назад
По-русски научитесь говорить. Ужос какой-то, а не речь. Апи, шедУлер, пушить, май - ну хоть бы тогда по-английски правильно говорил.
@CrazyHandMaker
@CrazyHandMaker 3 года назад
ужОс!
@Frezer911
@Frezer911 2 года назад
Самое нормальное обьяснение эйрфлоу на русском языке. Скиньте ссылки, если найдете лучше.
@ИльяШапорто
@ИльяШапорто 2 года назад
а как по вашему он должен говорить? вы видать не it или как? на будущие, так и выражаются разработчики. Никто не будет вам произносить как читается по английски, зачем? Странный коммент.. Airflow относится к devops инструментам, там никто не будет ввам с англйским акцентам произносить, вы индусов не смотрели или как?
@yaroslavsolntsev9909
@yaroslavsolntsev9909 7 месяцев назад
Сходите в индийский MS саппорт, там вам будет где позабавиться насчет акцента и прочих забавностей. )
@iexploiter
@iexploiter 7 месяцев назад
@@yaroslavsolntsev9909 там люди говорят не на родном своем языке. А этот мальчик по документации оснащен русским языком с рождения
@NurgisaBazarbaev
@NurgisaBazarbaev Год назад
Broken DAG: [/usr/local/airflow/dags/weather_api.py] 'Variable KEY_API_WWO does not exist' из за чего может быть эта ошибка в локалке
@КонстантинПечко-ы9м
в конце видео объясняют как задать эту переменную
@XXXXXX-vk1dm
@XXXXXX-vk1dm 3 года назад
Эй, ребята, это не etl-средство, это оркестратор! Можно конечно извращаться как вы в этом видео, но зачем?
@dblmok_
@dblmok_ 3 года назад
Смотрите плейлист дальше
@dblmok_
@dblmok_ 3 года назад
В данном видео не утверждается однозначность применения airflow как etl инструмента. В следующих частях отражены другие способы использования airflow
@XXXXXX-vk1dm
@XXXXXX-vk1dm 3 года назад
@@dblmok_ Всё, конечно так, но такие видео смотрят начинающие. И проблема в том, что они начинают делать так, как видели в обучающем видео )
@Sega4316
@Sega4316 3 года назад
@@XXXXXX-vk1dm а как надо правильно? есть примеры видео ?
@XXXXXX-vk1dm
@XXXXXX-vk1dm 3 года назад
@@Sega4316 правильно, если этот окестратор запускает те же SSIS-пакеты или пакеты Информатики (ну, или пакеты других etl-средств)
Далее