Лучшее на RU-vid
Кино
Авто/Мото
Видеоклипы
Животные
Спорт
Игры
Приколы
Развлечения
Хобби
Наука
Авторизоваться
Зарегистрироваться
【特異値分解③】特異値分解を計算に応用! - オトナな楽しみ方が求められる数式【行列25 RΣxiui = Σxiμivi】 #175 #VRアカデミア #線型代数入門
23:34
【強化学習】Q学習 - データを用いて最適方策を学習【強化学習の基礎アルゴリズム】RL vol. 14 #176 #VRアカデミア #ReinforcementLearning
34:10
#JasonDeruloTV // Dress 👗 #GotPermissionToPost From @lirika.vesa #MakeMeHappy
00:39
V16 из БЕНЗОПИЛ в ЖИГУ - ПЕРВЫЙ ВЫЕЗД
14:57
Voy shetga man aralashay | Million jamoasi
00:56
不靠谱的爸爸带娃!把孩子扔一边自己呼呼大睡,真是欠收拾!#funny#萌娃#搞笑
00:21
【強化学習】TD法 - 期待と不安が交じるベルマン作用素のデータ近似【強化学習の基礎アルゴリズム】RL vol. 13
AIcia Solid Project
Подписаться 57 тыс.
Просмотров 3,8 тыс.
50%
1
Видео
Поделиться
Скачать
Добавить в
Опубликовано:
30 окт 2024
Поделиться:
Ссылка:
Скачать:
Готовим ссылку...
Добавить в:
Мой плейлист
Посмотреть позже
Комментарии :
19
@小野賢一郎
7 месяцев назад
これからどんどん楽しくなりそうですね!期待値あげて、楽しみに待ってます!ささやかながら、ご飯代にどうぞ。
@AIcia_Solid
7 месяцев назад
ありがとうございます!!!!!🥰🥰🎉🎉🎉 いつもご支援いただき本当に助かります。 ありがとうございます! これからまたじゃんじゃん出していきますので、ぜひお楽しみにしていてください! 私も良き動画を生成できるよう精進します!🔥 いつも本当にありがとうございます!!!🎉
@niruru9560
7 месяцев назад
γとかαをAdamのような方法で調整ができれば、ひっぱられる問題を軽減できそうな気がしました。
@AIcia_Solid
7 месяцев назад
ご視聴コメントありがとうございます!🎉 面白い発想ですね!🎉 今後紹介予定の深層強化学習では、Adam などもよく用いられるので、学習率の動的調整はよく応用で使われてると思います! γについては私は存じないですが、小さいγから徐々に大きくするカリキュラム学習的な発想はあるのかな?などと想像しました。 興味に応じて調べてみるとよいかと思います!
@nire-hj9pe
6 месяцев назад
なるほど~、式の読み方の解説ありがとうございます
@AIcia_Solid
6 месяцев назад
ご視聴コメントありがとうございます! 今後もバンバン動画を出していきますので、ぜひ続きもご覧ください🥰
@kentoo_1
7 месяцев назад
1回から見始めてようやく追いつけました! TD誤差がマイナスになることはありますか?
@AIcia_Solid
7 месяцев назад
ご視聴コメントありがとうございます! はい、もちろんマイナスになることもあります! 設定によりますが、基本的にはプラスもマイナスも同じように登場します。
@kentoo_1
7 месяцев назад
変なデータは、良い方策ではないにも関わらずまぐれでゲームをクリアできてしまった時みたいな感じですかね
@AIcia_Solid
7 месяцев назад
こちはもありがとうございます😊 変なデータは色んなパターンがあります。 たまたままぐれでクリアできた場合もそうですし、 パラメタの初期化の都合でたまたま V の推定値が大きい / 小さいこともあったり、 実務データならバグ由来の外れ値データだったり、 色んなパターンがあるかと思います😊
@青野俊夫-y7q
6 месяцев назад
いつもながら分かりやすい説明ありがとうございます。「Vπ(s)よりr+Vπ(S')の方が精度高いと思っている。けど自信ないからα倍して変化減らしている」のあたりが印象的でした、Vπ(S)の分布を事前分布、r+Vπ(S')をデータとみなすと、Vπ-new(S)は事後分布。という風にBayes感覚で理解することもできるのでしょうか?そういえば、Vπ(S)は「平均値」。リスクを回避したい時の強化学習では、95%分位点とか、99.999%分位点のVπ(S)が大事になるのかな、、などと想像しました。
@AIcia_Solid
6 месяцев назад
ご視聴コメントありがとうございます!🥳 そうおっしゃっていただけるととても嬉しいです!🎉 Bayes 的感覚、面白いですね!!! 素敵な質問ありがとうございます!!!!! 実は、価値関数(等)を点推定ではなく分布で推定する分布強化学習 (Distributional Reinforcement Learning) という分野があります。 あまりそちらには詳しくないのですが、調べてみたらその解釈を活用している手法などもあるかもしれません👀 もしなにか面白いものを見つけたら教えていただけるとうれしいです!(^o^)
@青野俊夫-y7q
6 месяцев назад
@@AIcia_Solid ご返事ありがとうございます。キーワードとして頂いた「分布強化学習」の調査は未着手ですが、なんとなく、データ同化(EnKFや粒子法)のようなアルゴリズムになるのかなー と漠然と考えました。オン/オフポリシーをどう考えるか?も関係しそうに思えますので、Q学習/SARSAのご説明も楽しみにしております。
@AIcia_Solid
6 месяцев назад
分布強化学習は扱うときが来るかは未定です! 今後も色々出していきますので、ぜひお楽しみに!🎉
@青野俊夫-y7q
6 месяцев назад
ご丁寧にありがとうございます。❤
@otoppi7
7 месяцев назад
TD法のハイパーパラメータであるTDステップ数についての言及が欲しかったです。
@AIcia_Solid
7 месяцев назад
ご視聴コメントありがとうございます! ステップ数は、n-step TD 的なことでしょうか? であれば、Q 学習と SARSA の後に扱いますので、ぜひお楽しみにしていてください! (もし別のものを指している場合、私の不勉強で知らない可能性がありますので、そのときはお教えいただけますと非常に助かります!🙇♀️🙇♀️🙇♀️)
@otoppi7
7 месяцев назад
その通りNステップTD法のことです。1ステップずつブートストラップするTD(0)法とモンテカルロ法の中間的な手法で、オフライン学習用の手法です。最適なステップ数は通常5ステップとしているものが多いようです。
@AIcia_Solid
7 месяцев назад
なるほど、承知しました! ステップ数の使われ方もお教えいただきありがとうございます!🎉 それでは、もう少しお待ちいただけると助かります! ぜひお楽しみに!🥳🥳🥳
Далее
23:34
【特異値分解③】特異値分解を計算に応用! - オトナな楽しみ方が求められる数式【行列25 RΣxiui = Σxiμivi】 #175 #VRアカデミア #線型代数入門
Просмотров 1,8 тыс.
34:10
【強化学習】Q学習 - データを用いて最適方策を学習【強化学習の基礎アルゴリズム】RL vol. 14 #176 #VRアカデミア #ReinforcementLearning
Просмотров 4,3 тыс.
00:39
#JasonDeruloTV // Dress 👗 #GotPermissionToPost From @lirika.vesa #MakeMeHappy
Просмотров 7 млн
14:57
V16 из БЕНЗОПИЛ в ЖИГУ - ПЕРВЫЙ ВЫЕЗД
Просмотров 931 тыс.
00:56
Voy shetga man aralashay | Million jamoasi
Просмотров 544 тыс.
00:21
不靠谱的爸爸带娃!把孩子扔一边自己呼呼大睡,真是欠收拾!#funny#萌娃#搞笑
Просмотров 2,5 млн
36:52
【深層学習】word2vec - 単語の意味を機械が理解する仕組み【ディープラーニングの世界 vol. 21】#089 #VRアカデミア #DeepLearning
Просмотров 38 тыс.
21:23
【相関から構造を推定】因子分析の気持ちを理解する【いろんな分析 vol. 1 】#049 #VRアカデミア
Просмотров 60 тыс.
22:52
【強化学習】SARSA - こいつもデータを用いて最適方策を学習!【強化学習の基礎アルゴリズム】RL vol. 15 #178 #VRアカデミア #ReinforcementLearning
Просмотров 3 тыс.
27:14
How large language models work, a visual intro to transformers | Chapter 5, Deep Learning
Просмотров 3,5 млн
21:20
Cracking Enigma in 2021 - Computerphile
Просмотров 2,5 млн
22:13
SpaceX Secrets Leaked By Diablo Player - Deep Space Updates October 28th
Просмотров 364 тыс.
15:51
【機械学習】教師あり学習と教師なし学習の違い
Просмотров 142 тыс.
46:22
It's Not About Scale, It's About Abstraction
Просмотров 76 тыс.
18:55
Fresh AI Image, Video, & Screenwriting News!
Просмотров 11 тыс.
24:50
【深層学習】CNN紹介 "GoogLeNet" ILSVRC2014をInceptionで制したモデル【ディープラーニングの世界 vol. 15】#078 #VRアカデミア #DeepLearning
Просмотров 19 тыс.
00:39
#JasonDeruloTV // Dress 👗 #GotPermissionToPost From @lirika.vesa #MakeMeHappy
Просмотров 7 млн