[DeepLearning | видео 2] Градиентный спуск: как учатся нейронные сети

3Blue1Brown translated by Sciberia

Подписаться 47 тыс.

Просмотров 170 тыс.

50% 1

Видео Поделиться Скачать Добавить в

Оригинальная запись: • Gradient descent, how ...

Опубликовано:

9 авг 2020

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист

Посмотреть позже

Комментарии : 133

@user-pu1jg7tm9p 3 года назад

Буду честен, я не ожидал, что второе видео выйдет в озвучке. Я думал, что автор канала забил. Поэтому, спасибо! Я искренне благодарен, надеюсь, что озвучки продолжат выходить. Очень интересно!

@Kenderosik Год назад

на крайней случай можно включать такие видео в яндекс браузере. там нейронка их хорошо переводит :D

@linuxoidovich 8 месяцев назад

@@Kenderosikпроприетарщина

@linkernick5379 3 года назад

Молодцы, большое спасибо переводчикам.

@Mrsashafr 3 года назад

Шикарно, великолепно и доступно!

@paveldukov 3 года назад

Спасибо!🤝 Вы самая крутая команда в этом направлении.

@mtopsib 3 года назад

Впервые понял суть обучения, спасибо

@molotkovm Год назад

Это потрясающе! Большое спасибо за такое объяснение и отдельное спасибо за инфографику! Титанический труд

@SpanchBobSpannish Год назад

Это просто перевод, благодарности надо автору делать, а не переводчику

@user-nr6go3ez3x 7 месяцев назад

Просто супер! Спасибо)

@user-xe9vr2km7b 2 месяца назад

Спасибо, просто великолепная подача материала!!

@darkfrei2 3 года назад

Это всегда интересно :)

@aidenstill7179 3 года назад

Отличный контент!

@paul.antares 3 года назад

Ничего не понятно, но очень интересно. Зачем-то посмотрел оба видео)

@DataScienceGuy 3 года назад

Лол, чисто случайно зашел проверить , а тут новое видео)

@maksum4062 3 года назад

Когда новое видео

@maksum4062 3 года назад

Джамбул на пути к Машинному обучение и нейронным сетим

@MrDarkwolk 3 года назад

офигеть какой крутой канал, автор ты крут=)

@DarkFTP 3 года назад

Спасибо!

@TDMLab 3 года назад

Спасибо!)

@rubiks7196 3 года назад

Ура наконец-то перевод

@user-iz9sj1nn5q 7 дней назад

1:57 алгоритм 2:38 MNIST Database 3:10 4:00 вычисление функции ошибки (математическим языком - добавить квадрат разности между каждым "плохим" значением) 4:56 функция ошибки 5:19 6:50 7:04 7:34 8:02 многомерный анализ 8:24 9:18 10:06 10:42 ! 11:27 11:45 вычисл. градиента функции двух переменных 12:10 12:28

@flmew8133 3 года назад

Спасибо 🥰

@ARMALON87 Год назад

Очень полезно для новичка, спасибо!

@user--------- Месяц назад

Новичок относительно чего? Я например нихрена не понял....

@blacktechnology6496 2 года назад

Просто кайф!

@muhammadumarsotvoldiev9555 3 года назад

Спасибо вам

@KlimovArtem1 3 года назад

Вот это видео у него (изначального автора) получилось гораздо мощнее первого вводного!

@ilgarjafarov5482 2 года назад

super. ocen kruto.

@jefffox8301 3 года назад

Видимо это видео оценили только гики математики и программирования, жаль что таких не много, но я благодарю вас за проделанную работу, good luck ^ω^

@Staryi-Sceptik 3 года назад

Разве производную не проходят в школе?

@user-be4od3wp7f Год назад

@@Staryi-Sceptik Ну производную да, но во первых мало кто сидит и пытается понять ее смысл, а во вторых тут это все сложнее. Ну и вот у меня практически все виды математики были на первых курсах и я все это понимал и делал, но т.к. это совсем никак не использовалось я все забыл спустя пару лет, это конечно восстанавливается быстрее, чем учится, но все таки, шо говорить о школе.

@d14400 Год назад

Для гиков это слишком тривиальное видео

@yessenzhol8989 4 месяца назад

гики, объясните мне тупому пожалуйста. начиная с 4:00 поплыл: говоря математическим языком нужно добавить квадрат разницы между каждым плохим значением и его правильной величиной... что это такое? почему именно квадрат а не ^4 например, или не ^2/100

@user--------- Месяц назад

@@yessenzhol8989я тоже ниxрена не понял

@naturetechno6001 3 года назад

Спасибо

@pencil_12 3 года назад

Как всегда топ

@xev1882 2 года назад

бозе мой, где вы раньше были..

@maksum4062 3 года назад

Пока для меня это сложно. Но со временем я вернусь. ДС МЛ НС я иду за вами

@andrewkruchini8614 9 месяцев назад

Спасибо за перевод. Только хочу отметить неточность на 18:58: все же "accuracy curve" и "кривая доли правильных ответов" - это совсем не одно и то же по смыслу. Первое про точность (меньше - лучше), второе про успешость (больше - лучше). Резануло несоответствие картинки и звукоряда, подписи на графике заставили лезть в оригинал.

@stanislavserov8622 Год назад

Я ничего не понял, но спасибо за полезное видео!

@user-kb7sy3su8d 10 месяцев назад

Я тупич, и то суть дошла, спасибо!

@user-qi9lk4tp6o 3 года назад

Продолжай в том же духе! Я как раз пишу алгоритмы по нейросетям)

@user-vu9yd9fn8g 3 года назад

Ну, как успехи?

@user-nn1ko1uq6k Год назад

ну а как всё таки успехи

@Anna_Porosenok Год назад

@@user-nn1ko1uq6k да нихера их нет потому что здесь херово обьясняют а даже больше путают.

@user-fh9df3oi6r 5 месяцев назад

@@Anna_Porosenokа где хорошо объясняют?

@malk900g 2 года назад

И все же машина зазубривает, как и мы :)

@finn6088 2 года назад

А зачем квадрат разности тр🤔 чтобы не было отрицательных значений?

@danihov 2 года назад

Объясните, пожалуйста, момент с обучением на неправильных данных. Как сеть, которая обучалась на неправильных данных в итоге может показать такой же результат, как и та, что на верных. Ведь в первом случае для нейросети вилка всегда будет львом. Каким образом нейросеть может понять, что это не лев. Если никто ей не сообщает верных ответов. Видимо я понял неправильно. Буду благодарен, если кто объяснит ..

@duver2957 2 года назад

Могу путаться в терминах, но объясню как понял я. В первом случае они обучали сеть, выводя из нее данные в неструктурированном порядке. Например, в первой эпохе обучения они ввели в сеть картинку льва. Сеть выдала допустим вилку, но так как этот ответ не верен, мы корректируем ее работу функцией минимизации ошибки. Далее они изменили выходные данные, то есть изменили последний слой. Например на место, где результат был "вилка" она поставили "церковь". И далее начинается вторая эпоха обучения. Таким образом, сеть училась долго, но в итоге запомнила все объекты и стала выдавать нужный результат. А во втором случае они каждую эпоху не меняли последний слой, то есть появилась некая структура. И сеть обучалась гораздо быстрее.

@Azurelius 3 года назад

Функция ошибки это функция потерь (loss function) ?

@stepan-klyukin Год назад

хэллоу ворлд! в мире нейронных сетей

@datorikai9911 Год назад

Без музыки есть запись?

@Veyron104 3 месяца назад

6:12 допустим w в данном случае 2, "мы" спускаемся к 1, но это же не минимум? Минимум будет в -2. Как нам туда попасть, если придётся идти "вверх по горке" ??? 8:35 т.е. в этом случае, если бы минимум функции был не в (3;0), а в (0,5; -2) то пунктирная линия бы прошла "условно" почти "перпендикуляром к оси" от места поворота пунктирной линии?

@oladushek1337 Год назад

4:05 к чему добавить?

@emptyasdf 11 месяцев назад

Нарисовано красиво, но в конечном итоге взять и применить отсюда что-то не представляется возможным. Просто концепт объяснили красочно.

@alexandermartin5694 9 месяцев назад

Это и есть смысл видео, объяснить принцып работы и математику нейросети, а не забивать в питон тупо функции из каких-то библиотек.

@iwouldliketoknowittoo7004 3 года назад

Більше перекладів!

@haykharutyun3708 Год назад

А как создать функцию ошибки? Как программа должна понять ошиблась она или нет?

@endlessvd 11 месяцев назад

Sus

@YY-zw2ec 3 года назад

Так если делать раз в год видео по нейронным сетям то мы их так и не выучим

@rrraaa9854 2 года назад

Так что здесь мне кажется что программист учится таким образом составлять новые алгоритмы, то есть обучается))

@kuntumeitan 10 месяцев назад

Ничего не понял, но очень интересно

@user-ju2fm9og4f 3 года назад

Не очень понятно про обучение на неверно размеченных данных. Сеть ведь не сможет правильно классифицировать новые изображения не из обучающей выборки. Или я чего-то не понял. Что означает фраза "на обучающих данных удалось добиться той же точности, что и на правильных данных"?

@YY-zw2ec 3 года назад

Наверное правильные = проверечные(valid data)

@kirillusenko 3 года назад

В процессе обучения показываются картинки с правильным ответом и сеть учится

@Staryi-Sceptik 3 года назад

Сеть просто запомнила новые названия для картинок. А не создала способ анализа изображения картинок

@igorshelby5950 3 года назад

Ответ на вопрос в конце видео заключается в использовании сверточного слоя нейронов?

@constantinveltmann7196 3 года назад

А что если запустить сеть в обратную сторону? Допустим дать ей на нейрон отвечающий за 1 единицу, а на остальные нули. Пройти по обратному пути и построить изображение из входных нейронов, что она покажет? Идеальная единица с точки зрения нейросети

@1Hanch 3 года назад

Там много разным методов есть как понять неросеть и этот тоже. Например можно посмотреть за что конкретный нейрон отвечает, для этого надо найти значение функцию выхода этого нейрона относительно изменяющихся входных значениях всей нейронной сети при не изменяющихся весах, и провести градиентный подъем, будет найден входной рисинок при котором максимально активируется нерон. Есть для сверточной сети визуализация тепловых карт активации класса, уверен для этой сети тоже подобное можно применить

@1Hanch 3 года назад

тут регуляризацию можно понять и много другое playground.tensorflow.org/

@endlessvd 11 месяцев назад

Она покажет лишь 2 рисунка, поскольку может быть лишь 2 входа, 0 и 1

@constantinveltmann7196 11 месяцев назад

@@endlessvd ничего, что там 10 выходных нейронов? то есть если инвертировать нейронку, будет так же 10 входных можно задать им строго единицу на один из этих нейронов, чтобы получить идельную цифру, а можно поиграться с десятичными значениями, чтобы получить 50/50 то ли 1 то ли два итд

@hottabych137 2 месяца назад

Что если... 🤣 Фарш в мясо нельзя обратно превратить

@vinsler 3 года назад

Нужно добавить значение ошибки, это квадрат разности. А откуда сеть узнает, что именно на рисунке, чтобы определить куда пихнуть 0, а куда 1 ? Это уже не самообучающаяся сеть, а обучаемая, причем на каждую картинку, не сеть определяет правильность, а человек. А на 5 000 000 картинок, задавать правильность, на это уйдет очень много времени. И хорошо, если это уже всем известная система, а если она ноу-хау, и там не 5 млн картинок, а 100 триллионов?

@barkalov 3 года назад

Есть "обучение с учителем", есть "обучение без учителя". Это разные подходы. Чтобы запилить подобную сеть "без учителя", нужно чтобы на входе и выходе сети было одно и тоже (768 пикселей-нейронов), а в середине сети, на скрытом слое - бутылочное горлышко из 10 нейронов. Тогда сеть будет вынуждена "пропихнуть" изображение каждой цифры через эти 10 нейронов, и восстановить/нарисовать цифру обратно на выходе. Для этого изображения цифр уже НЕ нужно предварительно размечать, сеть их классифицирует самостоятельно на том самом узком слое посередине. Функция ошибки в данном случае будет то, насколько выход сети похож на вход. Можно представить, что такая сеть пытается "заархивировать" изображение в 10 нейронах, а потом "разархивировать" обратно. Для этого она вынуждена будет их классифицировать. Самостоятельно. То есть, без учителя. Profit!

@asanAzimkulov 2 года назад

Синиормын

@user--------- Месяц назад

Я ничего не понял. То есть чтобы узнать значения потерь нужно разметить вручную (!!) сотни правильных примеров?

@KlimovArtem1 3 года назад

Почему в конце голос сменился?..

@hottabych137 2 месяца назад

Первый голос УСТАЛ

@Felix-og7pd Год назад

hidden layers - key

@alexandersapronov9281 6 месяцев назад

чёта я не понял с ходу, как вычисляется компоненты градиента ошибки для весов всех нейронов кроме выходного слоя видимо пойдё читать книгу Нильсена...

@andrewsed_uplisten2019 3 года назад

ничего не понял , но очень интересно

@iliasmirnov2938 3 года назад

Хотелось бы больше переводов...

@user-fz5mh8nj1y Год назад

нифига не понял, но очень интересно

@maksymz6695 2 года назад

Я все еще не понял как узнать что полученный результат верный / не верный ? С чем и как сравнивать ?

@Anna_Porosenok Год назад

Заранее знать правильный ответ , напимер подаёшь рупоисную ужаную единицу и там её можешь распознать как единицу и сети говоришь что на выходе долна быть единица распознана и если приходит на выходе не еденица то программа сравнивает с твоим ответом уже заложенным, понимает что ошиблась и надо менять веса, изменяет веса и вновь пропускает рукописную туже единицу через себя и потом все по кругу пока чётко или при очень большем проценте не станем понимать что это единица , которую ты сам сказал что она должна там быть.

@hottabych137 2 месяца назад

@@Anna_Porosenok Если надо определить какого-то животного, насекомого, то нужно сделать 100500 выходов?

@Anna_Porosenok 2 месяца назад

@@hottabych137 ну так то да..., но сейчас алгоритны другие , скажем так , они делят на части , разбивают потом собирают , и обратно уже суженым фильтром распознвют и тогда уже точно выйдет что надо. Хочу скать что выдумывают разные алгоритмы все сложнее и сложнее , но зато они повышают круг распознования.

@hottabych137 2 месяца назад

@@Anna_Porosenok ага, понятно. Спасибо

@Hengst. 3 года назад

жаль, что версию для хлебушков не завезли)

@leonidvalentinovich5215 3 года назад

Это она и есть ) Те, кто в универе учился, а не сидел смотря лекции Стендфорда :-)

@rrraaa9854 2 года назад

Если изменить разрешение пикселей то сеть заново перестраивать?

@Anna_Porosenok Год назад

Да, верно, но можно написать алгорит м который рисунок сам будет или уменьшать или увеличивать разрешение до нужного для нейросети ,это не так сложно.

@user-gs1li9mb6s Год назад

@@Anna_Porosenok в любом случае, каждый последующий и, кажущийся самостоятельным и разумным, шаг сети - результат предшествующих этому шагу действий программиста (человека). ИИ на основе дискретной логики - миф) Весь фокус и вау-эффект от знакомства с ИИ зиждется на возможности железа считать с чудовищной (абстракция) скоростью. Ловкость рук - и никаких чудес.

@Anna_Porosenok Год назад

@@user-gs1li9mb6s это и так понятно, можно было об этом не писать.

@user-gs1li9mb6s Год назад

@@Anna_Porosenok судя по тому, что человечество упорно живет между черным и белым, не зная других оттенков, это понятно далеко не всем)

@Anna_Porosenok Год назад

@@user-gs1li9mb6s в следующий раз в переди поста как раз вот это и пиши, что бы яснее твоя мысль была.

@user-ns9pb8ml1m 11 месяцев назад

17:46

@Nemo-us6is 2 года назад

Ну все скоро я создам свого джарвиса будет по круче алиси и сири)

@user-qe8wj3qi3l Год назад

Почему алгоритм все упрямо называют нейросетью? Какое-то новомодное поветрий. Хотите создать нейронную сеть - поступайте как нейроны, а не как алгоритм. Этакий нейронный алгоритм. Но для этого придется на физическом уровне создать сеть нейронов, основная особенность этой сети - она обрабатывает информацию одновременно в большом поле нейронов. А когда обработка идет в звеньях последовательно - это просто разветвленный алгоритм.

@samedy00 11 месяцев назад

Ну так нейроны примерно так же работают. Сигналы передаются от уровня к уровню последовательно.

@LapshinLAB Год назад

784+1 нейрон = 785 на входе, один нейрон для смещения

@endlessvd 11 месяцев назад

Sus нейрон 👀👀👀

@XeneZ_ Год назад

3:48 бедная нейросеть за что с ней так строго

@maksimsaikin3721 Год назад

Для 15-летнего - это взрыв мозга

@user-gp4xy2hf1o 5 месяцев назад

людям младше все понятно

@user--------- Месяц назад

Я посмотрел наверное с пару десятков видео про Nl и прочитал несколько десятков статей, но я до сих пор ниxpeна на понял как это работает.... 😢 Я пока сделал только один вывод - дадасапиенсы либо банально не умеют объяснять предмет для широких масс, либо сами не до конца понимают. Увы.

@xxphall 11 дней назад

я не понял ваш комментарий = вы глупый. забавная логика. зачем массовому зрителю что-то объяснять? Его дело - обычное потребление результатов

@user--------- 11 дней назад

@@xxphall Логика в том, что если ты не умеешь объяснять (часто равно не знаешь предмет), то не нужно объяснять, ибо ты только запутываешь людей и тратишь их время. Сквозь тысячи видео/постов го*на очень сложно найти нормальные материалы. Теперь понятно?

@xxphall 11 дней назад

@@user--------- ну это проблема либо твоя, либо авторов этих видео (скорее второе). нормальные материалы = научная литература и научные статьи, а не видео на ютубе... еще бы в википедии искал

@bald_agent_smith 2 года назад

Весь мир это градиентный спуск, а ты в ней функция, которая ищет правду

@endlessvd 11 месяцев назад

Прям как твоя мамка

@rrraaa9854 2 года назад

Вы зачем вводите термин как -Сеть обучается??? Если вы сами тут же говорите что закрепляете вначале алгоритм,потом настраиваете все точки пределов,(то есть формируете память,как это было раньше)а потом ваша якобы обучающаяся сеть просто -выбирает варианты Смотрю ваши материалы ,,,нихрена не поняла где нейронные сети обучаются,

@Anna_Porosenok Год назад

Да нигде , тупое видео херню несут сумбурную , там олени не поняли что такое нейронные сети и запилил видео , а ут ещё перевод.

@barkalov 3 года назад

Посткриптум, надиктованный женским голосом, переведен гораздо хуже основного материала. Ощущение, что диктор совершенно не понимает о чем говорит, и голос не вполне не синхронизирован с тем, что происходит на экране. Основная часть перевода сильно лучше.

@user-ny8dh8bu5v 6 месяцев назад

вода

@hottabych137 2 месяца назад

Мдаа... видео хоть и качественное, сделано грамотно, визуализация крутая, но... НИЧЕГО НЕ ПОНЯЛ, было просто интересно. 🤣

@Ciber-FanSistems 3 года назад

нужно дописать!!! мало ходов !!! ПоЭтоу думает плохо!!!

@timbond6176 5 месяцев назад

Что такое градиентный спуск мне объяснять не надо. Но боже ж ты мой - насколько запутанное и невнятное объяснение в этом ролике...Некоторые технические детали остаются вообще "за кадром".

@iamdan8203 3 года назад

Кто бы ни читал этот комментарий, знай, что *ГОСПОДЬ ИИСУС ХРИСТОС ЛЮБИТ ТЕБЯ!* Whoever reads this comment, know that *LORD JESUS CHRIST LOVES YOU!*

@rrraaa9854 2 года назад

Боже мой...признаемся честно все эти обучения проходят в обусловленной системе,все жиждется на замкнутой платформе,о каком уме идёт речь???? О каких нейронах речь???о лампочках?где есть начальный код,то никаких обучения кроме как программиситов не может быть.