No video :(

Поиск объектов на видео с Python и TensorFlow с нуля, cтроим и обучаем нейросеть UNet

Подписаться 1,3 тыс.

Просмотров 50 тыс.

50% 1

В этом видео я хочу рассказать как можно с нуля разработать и обучить нейронную сеть для распознавания объектов на изображениях.
00:00 - Введение
00:39 - Виды задач распознавания
01:17 - Применяемые архитектуры нейронных сетей
02:00 - Система распознавания объектов
02:39 - Разметка данных
05:04 - Загрузка данных в TensorFlow
09:57 - Способ обработки изображений
11:00 - Архитектура UNet
13:10 - Реализация сети в Keras и TensorFlow
14:56 - Функции потерь и метрики
17:41 - Обучение нейронной сети
19:01 - Тестирование нейронной сети
Исходный код
colab.research...
Статьи
⁃ SegNet arxiv.org/pdf/...
⁃ DeepLab arxiv.org/pdf/...
⁃ UNet arxiv.org/pdf/...
⁃ Обзор функций arxiv.org/pdf/...

Опубликовано:

28 авг 2024

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист

Посмотреть позже

Комментарии : 69

@goga-pro2024 7 месяцев назад

самое лучшее обьяснение за всю мою жизнь, а я с нейронками с 2014 года, обьясни людям в следующем видео как продолжить обучение не начиная с нуля, этого матерьяла мало в нете

@user-zs4kv4ii7d 17 дней назад

Великолепный подход. Жаль, что мало тем. Вы очень многим помогли. Спасибо.

@ernisesama1636 2 года назад

Наверное самое понятное обяснение на RU-vid. Продолжай пожалуста

@user-ji5fe9pb2b 2 года назад

Отличное Видео. С пояснением всего что сделано. Автору большое спасибо. Если такое же видео будет сделано и для других типов сетей или например PyTorch, было бы очень круто! Автору большое уважение.

@TheBestSurvival Год назад

Качественно и доступно, а главное реально интересно и полезно! Автору желаю 100500 подписчиков))

@cekkush 2 года назад

Павел, очень доступно. Огромное спасибо. Ждём продолжения! Привет из Азербайджана.

@user-py2bu9ky2x 2 года назад

Отличное видео! Спасибо автору за работу!

@bekabad Год назад

Теперь я знаю, про что будет моя дипломная работа! Спасибо!

@timur.shhhhh 2 месяца назад

Классное видео, все понятно объяснил, ещё попробую на этой недели протестить, если получится, напишу в PS(если не забуду).👍

@rspdno 2 года назад

Спасибо за ролик!

@user-ji6ge3py9d 2 года назад

Надо же как интересно . Класс! Здорово придумано.

@727doto 2 года назад

Отличное видео, спасибо, очень интересно! С нетерпением жду продолжения !

@dyachenkokonstantin67 2 года назад

Спасибо, очень чисто и понятно.

@user-ov8jm4uv3w Год назад

Спасибо! Отличное видео! Все настолько хорошо объяснили!

@user-xc9vu6xq2r 2 года назад

Очень полезное видео ! Спасибо большое !

@lecturer_abramenkova 2 года назад

Спасибо)

@user-jh4rw8wr5b 2 года назад

Очень круто, спасибо большое

@nikolaynovikov5756 2 года назад

Жду следующие видео, когда будет ???

@yood1e Год назад

Годнота

@seoonlyRU 2 года назад

красота) лайк от СЕООНЛИ!

@user-sk8pc2mc1u 2 года назад

Очень полезное дело 👍

@user-ct6zd7xm8s Год назад

круть

@MrKappasama 5 месяцев назад

Спасибо за видео! А можете подсказать, в какую сторону копать если нужно найти бинарную маску блоков текста на картинке? (в идеале так вырезать текст и восстановить фон)

@user-gv3fx2jh7i 2 года назад

когда пытаюсь вставить свои изображения вылезает такая ошибка: TypeError: Input 'filename' of 'ReadFile' Op has type float32 that does not match expected type of string. что мне делать?

@revoluxe Год назад

💪

@kirilllas7247 2 месяца назад

Как сделать чтобы нейронка распознавала нужные изображения в браузере, например листаешь вкладку с фотографиями, и она как то распознает нужное, по стокам

@s1ngle77 2 года назад

Блин круто препод топ

@GAVNO 2 года назад

спасибо

@PLenchak 10 месяцев назад

Отличное видео! Подскажите, как можно распечатывать карты признаков по мере обучения?

@RockstarAlexander 2 года назад

👍👍👍👍👍👍👍👍

@arhalexxx 6 месяцев назад

переобученная модель может получиться, если аугументация это простое копирование. Только эти предметы и будет хавать и то не всегда. чуть другая форма, тон и всё. Интересно вот как видеокарта настроена, если Вы ей собираетесь обучать.

@user-qm9xh3je4y 10 месяцев назад

Здравствуйте, у меня вопрос, чем кардинально будет отличаться данный метод от метода локализации? Суть же останется той же, только объект будет всего лишь один или есть различия?

@meowxd1337 Год назад

А есть какой нибудь готовый датасет для лис, котов итд?

@user-wj8po5ou5c Год назад

Отличное видео. Подскажите, а что за среда разработки используется на видео?

@user-of-world Год назад

Юзай Google collab, офигенная штука

@user-mk6yf4lu3p 7 месяцев назад

А для чего применяется подряд tf.image.convert_image_dtype и следом нормализация image/255? Разве это не одно и тоже?

@user-ov8jm4uv3w Год назад

Кстати. А вот если задача стоит так, чтобы модель к цвету не привязывалась, а к форме - перевод в градации серого решит задачу? Например, изменение освещенности это сможет решить?

@user-cm8fi9vo8h Год назад

Здравствуйте, а куда сохраняются уже обработанные кадры? По коду они должны сохранятся в репозиторий videos/processed, я повторил, но у меня ничего в этой папке не появляется. Помогите, пожалуйста!

@user-cm8fi9vo8h Год назад

ПОМОГИТЕ ПОЖАЛУЙСТА

@user-fn4yc7un8z 11 месяцев назад

Добрый день! Отличное видео, спасибо. Подскажите пожалуйста, в каком формате вы экспортировали данные из supervisely?

@lyftzeigen 11 месяцев назад

Здравствуйте! Sypervisely обновился, наверное сейчас это называется "Export to masks".

@user-fn4yc7un8z 11 месяцев назад

@@lyftzeigen большое спасибо!

@dmitrykhomyakov8451 8 месяцев назад

@@user-fn4yc7un8z Sypervisely. не предлагает экспорт в таком формате. На выбор дано 6 вариантов: Sypervisely, YOLO8, просто images (видимо без аннотаций), DOTA, COCO Keypoints, image links to CSV. Какой из этих форматов можно использовать в коде по Вашему видео?

@Grenkitop Год назад

Добрый день , Павел .Как с вами связаться ? Я хочу попросить вас обучить Аи под мою модель , я заплачу. И если интересно в дальнейшем мне нужна будет помощь для добавления разных объектов в мою библиотеку . В целом возможно долгосрочное сотрудничество в этом направлении

@user-nj5vi5dh2f Год назад

Добрый день, спасибо за видео) очень помогло Но есть один вопрос, как подтянуть координаты пересмотра классов?

@user-cm8fi9vo8h Год назад

А куда сохраняются обработанные кадры? Подскажи пожалуйста Или как сохранить их локально?

@djosmer2 Год назад

Подскажи. Допустим есть картинка, на ней один объект и снизу рядом текст, надо сделать рамку вокруг объекта с текстом. Сделать обводку не пойдет, т.к. повторяет форму объекта, надо чтоб линия плавно обводила объект с текстом, например как у стикеров. Сможет ли это сделать нейронка?

@lyftzeigen Год назад

На мой взгляд, применять нейросеть для решения такой задачи, не самое оптимальное решение. Думаю, что проще воспользоваться классическими методами, например, выделение контуров текста и применение морфологических операций с последующей обработкой.

@grey111111111 6 месяцев назад

На Colab ошибка на ячейке с обучением модели: InvalidArgumentError: Graph execution error:

@grey111111111 6 месяцев назад

поменял GPU на CPU и заработало, почему так может быть?

@user-cq3tt9fv9j Год назад

Здравствуйте. Имею следующую ошибку во время первой эпохи обучения: ValueError: Dimensions must be equal, but are 400 and 8 for '{{node dice_bce_mc_loss/mul}} = Mul[T=DT_FLOAT](dice_bce_mc_loss/unstack, dice_bce_mc_loss/unstack_1)' with input shapes: [?,400,500], [?,8,8]. В коде изменил лишь размер изображения (на 400x500), количество классов-цветов (с 8 на 2) и добавил указание количества каналов для png (mask = tf.io.decode_png(mask, channels=3)), а также небольшое изменение в Skip Connections - downsample_skips = reversed(downsample_skips[:0]). На какую часть программы порекомендуете взглянуть? Спасибо.

@lyftzeigen Год назад

Здравствуйте! Изменение разрешения изображения тянет за собой все остальное. Нужно разобраться в размере данных, которые проходят через нейросеть и через все функции. А порекомендую взглянуть на связку YOLO + Roboflow: blog.roboflow.com/train-yolov7-instance-segmentation-on-custom-data/

@user-or5rm1ud9y 2 года назад

Уважаемый автор, не могли бы вы помочь и предоставить файл с моделью нейронной сети которую Вы реализуете в данном ролике

@lyftzeigen 2 года назад

В описании к видео есть ссылка на Google Collab, где вы можете самостоятельно опробовать работу нейронной сети.

@user-or5rm1ud9y 2 года назад

@@lyftzeigen я имею ввиду схему нейронной сети, которая у вас демонстрируется на 2:30

@iiiyx Год назад

Слишком много "почему" после просмотра, поэтому это, увы, не обучающее видео.

@somebody5186 Год назад

!!!

@jeremyfox3031 Год назад

"хорошее видео" "отличное видео" "очень полезно" и бла-бла-бла пустая, никчёмная болтовня, которая никого, ничему и никогда не научит

@MrSatanizd Год назад

г_спади видос на 11 из 10 по объяснению и демонстрации как вся это нейронная хня работает!!!!111. Есть ли возможность связаться с автором видео для общения по разработке решения распознавания объектов на видео?

@user-pc2ge5km9s 2 года назад

Как размечать, как выгружать - ни слова об этом :(

@rspdno 2 года назад

согласен - это достаточно полезная информация была бы!

@user-ji5fe9pb2b 2 года назад

На счет этого можно посмотреть видео по разметке данных именно указанными инструментами. Хотя согласен, можно было бы добавить описание.

@romastep6576 Год назад

Очень интересно, но почти ничего не понятно. Не в сторону автора выпад, а в сторону недостаточности моих знаний для полного понимания разжеваного до атомов материала 😂

@ilyatarasevich1008 25 дней назад

File "C:\1111\1111\1111\main.py", line 12, in load_images * image = tf.io.image.convert_image_dtype(image, tf.float32) AttributeError: module 'tensorflow._api.v2.io' has no attribute 'image'

@ilyatarasevich1008 25 дней назад

Помогите пожалуйста решить ошибку

@mattewcox7065 Год назад

кто нибудь сталкивался с проблемой, что именно маски не читаются с ошибкой: InvalidArgumentError: Matrix size-incompatible: In[0]: [189888,1], In[1]: [3,1] [[{{node rgb_to_grayscale/Tensordot/MatMul}}]] [Op:IteratorGetNext]

@mattewcox7065 Год назад

@@aligatorpe а я ззафиксил кстати и забыл как уже