Тёмный
NOdata Миша
NOdata Миша
NOdata Миша
Подписаться
Работаю дата инженером и говорю об этом
Комментарии
@boulevardgaidena.k.a3555
@boulevardgaidena.k.a3555 День назад
За 10 минут описал то, что я месяц пытался понять из разных отрывков дагов и доки на работе)) еще смотрел модуль по airflow из Карпов курсов - фигня полная, по сравнению с этим объяснением, тут понятно что зачем и для какой цели
@NOdatamisha
@NOdatamisha День назад
Спасибо за комментарий!)
@АлексейП-л7ь
@АлексейП-л7ь 3 дня назад
Привет, Михаил! Спасибо за видео! Чуть не понял одного: есть операторы для Airflow, которые умеют в SQL. Но я думал, что все операции мы выполняем уже внутри таска, например, Load, где мы пишем логику: 1) Получаем данные из предыдущего таска (например, таска Transform) 2) Предположим, мы хотим, чтобы при повторном запуске записи за предыдущий день затирались, вместо которых загружались новые (типичная инкрементная загрузка). Получается, что в таске Load прописывается "DELETE FROM schm.table where dt = :date_to_delete" и там же прописывается with engine.connect() as conn: и так далее, которое по пути удаляет записи и загружает командой df.to_sql(.. .. .. ..). Я к тому, что для чего в этом случае нужны именно что отдельные sql-таски, если база является, по сути, просто конечной точкой? И хотелось бы видео про способы передачи данных между тасками. Хуки, файлы и так далее. Спасибо! :)
@NOdatamisha
@NOdatamisha 3 дня назад
Привет! По поводу передачи файлов: по xcom есть видео на бусти boosty.to/nodata_misha/posts/a56f75f2-02e4-4eac-a6d5-a8c67f59aaee но возможно что-то и на ютуб выпущу Не много не понял по вашему комментарию, но если я правильно понял, то можно например сделать так: В первой таске Получаем данные и передаем их во вторую таску, которая может как раз является Postgres оператором, в который мы просто передаем 2 sql кода (удаляем вчерашние, загружаем сегодняшние), можно наверное даже в одном передать
@NOdatamisha
@NOdatamisha 19 дней назад
Видеоуроки для data специалистов - boosty.to/nodata_misha
@NOdatamisha
@NOdatamisha 19 дней назад
Видеоуроки для data специалистов - boosty.to/nodata_misha
@NOdatamisha
@NOdatamisha 19 дней назад
Видеоуроки для data специалистов - boosty.to/nodata_misha
@NOdatamisha
@NOdatamisha 19 дней назад
Видеоуроки для data специалистов - boosty.to/nodata_misha
@NOdatamisha
@NOdatamisha 19 дней назад
Видеоуроки для data специалистов - boosty.to/nodata_misha
@NOdatamisha
@NOdatamisha 19 дней назад
Видеоуроки для data специалистов - boosty.to/nodata_misha
@NOdatamisha
@NOdatamisha 19 дней назад
Видеоуроки для data специалистов - boosty.to/nodata_misha
@NOdatamisha
@NOdatamisha 19 дней назад
Видеоуроки для data специалистов - boosty.to/nodata_misha
@nikitateterev9787
@nikitateterev9787 23 дня назад
Классное видео! Подскажи, что за тул для БД исплользуешь?
@NOdatamisha
@NOdatamisha 23 дня назад
Спасибо! К БД подключаюсь через DBeaver
@nadzhibkuziev8057
@nadzhibkuziev8057 2 месяца назад
Молодец
@samodelkinmichael
@samodelkinmichael 2 месяца назад
Теперь я тоже мамкин дата инженер 🙂 Спасибо 🚀
@NOdatamisha
@NOdatamisha 2 месяца назад
Многие мечтают быть дата инженерами, просто не осознают этого 😎
@samodelkinmichael
@samodelkinmichael 2 месяца назад
Добавил в избранное и курс по докеру тоже 👍
@samodelkinmichael
@samodelkinmichael 2 месяца назад
Спасибо, хорошее введение в профессию, понятно и без пафоса
@NOdatamisha
@NOdatamisha 2 месяца назад
Спасибо Возвращаетесь еще за кучей полезных видео)
@m3s7
@m3s7 4 месяца назад
продолжайте. Жду продолжения. Интересно посмотреть на реальные задачи. Спасибо 💪🏼
@NOdatamisha
@NOdatamisha 4 месяца назад
Спасибо за комментарии! Продолжение обязательно будет)
@dealenx
@dealenx Год назад
Спасибо большое за видео, очень помогло! Можно ли для ExecuteStreamCommand как-то задавать параметры и считывать их в скрипте?
@NOdatamisha
@NOdatamisha Год назад
Самому не приходилось, но вроде можно. Можете почитать в документации nifi.apache.org/docs/nifi-docs/components/org.apache.nifi/nifi-standard-nar/1.17.0/org.apache.nifi.processors.standard.ExecuteStreamCommand/index.html
@dealenx
@dealenx Год назад
@@NOdatamisha Хорошо, спасибо! Как я понял, это делать через аргументы для команды запуска программы. Только вот вопрос, можно ли задавать глобальные переменные для пайплайна и подставлять в аргументы команды запуска?
@NOdatamisha
@NOdatamisha Год назад
@@dealenx можно создать атрибут и его подставлять. Завтра попытаюсь поподробнее рассказать)
@dealenx
@dealenx Год назад
@@NOdatamisha Хорошо, спасибо!