Тёмный

Как работает автоматическое дифференцирование в глубоком обучении? 

Лёша Бухтияров
Подписаться 750
Просмотров 1,4 тыс.
50% 1

Опубликовано:

 

1 окт 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 3   
@VirVen
@VirVen 11 месяцев назад
18:47 у тебя dv3/dv1 = e^y ' = y * e^y = -1 e^(-1) и тогда получится 4 - 1/e как в прямом методе)
@ИванЕвдокимов-л6ь
А в обратном методе библиотека вычисляет все Vi путем подстановки чисел до вычисления производных, а потом хранит их в памяти в вершинах графа (т.е. до вычисления всех df/dVi алгоритм вычислит V3=e^-1~0.37 и положит в кортеж для V3, вычислит V5=-4+e^-1=-3.63 и положит в кортеж для V5 и тд)? И если для вычисления dV4/dV1 нужно значение V2, то алгоритм заново пройдет по графу, дойдя до кортежа с V2 на первом месте и возьмет оттуда уже вычисленной значение? И я правильно понимаю, что этот метод - это просто обычное дифференцирование сложных функций из 10ого класса?
@СергейИванов-п1ш3ч
Очень нравятся твои объяснения. Не забрасывай
Далее