Лучшее на RU-vid
Кино
Авто/Мото
Видеоклипы
Животные
Спорт
Игры
Приколы
Развлечения
Хобби
Наука
Авторизоваться
Зарегистрироваться
【特異値分解⑥】直交行列の等長性 - 回転ってこれで定義されてるんです【行列28 ||Ux|| = ||x||】 #181 #VRアカデミア #線型代数入門
22:35
【強化学習】全体像を見据えておこう【2つのループが特徴】RL vol. 3 #153 #VRアカデミア #ReinforcementLearning
12:45
Почему Бондарчуки бросили дочь с ДЦП? Полный ролик в VKвидео #психология #дцп #дцпдети
00:55
Random Emoji Beatbox Challenge #beatbox #tiktok
00:47
МЖ. Может, папа - ты? 16.02.2023
40:03
Как получить игры БЕСПЛАТНО? Нужен ПРОСТОЙ трюк... / #игры #gaming #булджать #rpg #2024
01:00
【強化学習】On-policy と Off-policy - 実は定義が曖昧な概念【強化学習の基礎概念】RL vol. 16
AIcia Solid Project
Подписаться 57 тыс.
Просмотров 2,4 тыс.
50%
1
Видео
Поделиться
Скачать
Добавить в
Опубликовано:
30 окт 2024
Поделиться:
Ссылка:
Скачать:
Готовим ссылку...
Добавить в:
Мой плейлист
Посмотреть позже
Комментарии :
14
@gesonanko6356
4 месяца назад
めっち以前フレンドに上手く説明出来なくてモヤモヤしてた内容だったのでめっちゃ納得しました!ありがとうございます!
@AIcia_Solid
4 месяца назад
げそんさんどうも! ご視聴コメントありがとうございます🤩 いやーーー、もやりますよね、これ😇 この理解ご活用いただけると嬉しいです!とともに、プロの視点からツッコミ発見したりしたらぜひ教えてください!!!
@とおるくん-k7q
3 месяца назад
理学部数学科卒のアラフィフのおっさんです。アナログ世代でこんな動画があったらと思います。外資系製造でファイナンシャルコントローラーしているけど。数学のほうが断然好きです。会計ファイナンスはサラリーマンとして生きていくため仕方なく勉強した。このシリーズハマってます。データサイエンスの仕事したいな。
@AIcia_Solid
3 месяца назад
ご視聴コメントありがとうございます!🎉 実は強化学習は、まだそんなに仕事が多くはないのですが、、、! この先増えると思いますので、先立って勉強しておくのは悪くないと思います! データサイエンスはデータサイエンスでそれなりに泥臭い仕事ではありますが、興味を持っていただいてとても嬉しく感じます!
@jyoan_ai-yy1ip
4 месяца назад
最近機械学習の勉強を始めました。 新作の投稿ありがとうございます。 応援しております。
@AIcia_Solid
4 месяца назад
ご視聴コメントありがとうございます!🎉 これからも良き動画を生成できるようがんばります!🔥 ともに勉強していきましょー!(^o^)
@nire-hj9pe
4 месяца назад
いつもありがとうございます。 まさかそんな野菜と果物みたいなノリだったとは…笑 これを念頭に置いてもう一度教科書読んでみます!
@AIcia_Solid
4 месяца назад
そのたとえ素敵ですね🤣 ありがとうございます🥕 この視点で見ると色々理解が深まりやすいと思います(^o^) 是非トライしてみてください!
@otoppi7
4 месяца назад
いつも分かりやすい解説ありがとうございます。On-Policyであることの本質は、次の行動a'までのワンセット(SARSA)でとらえて学習させるかということかなと見ています。次の行動をとらえるには当然それを決める方針が必要で今の行動に対する方針と同一でなければならないのは当然かと。予想すべきは行動ではなく方針だとでも言いたそうな...結果的には、よりリスクに敏感で安定した探索が可能だが、遅くなりがち...そこを何とかできないものか?
@AIcia_Solid
4 месяца назад
ご視聴コメントありがとうございます! 素敵な考察だと思います! 次回、n-step TD の話の中で n-step Q 学習を紹介しようと思います。それが On か Off か、自分なりに検討してみていただけると嬉しいです!
@niruru9560
4 месяца назад
on-policy / off-policy 知らなかったです
@AIcia_Solid
4 месяца назад
ご視聴コメントありがとうございます! 便利な概念ではあるので、是非ご活用くださいませ😊
Далее
22:35
【特異値分解⑥】直交行列の等長性 - 回転ってこれで定義されてるんです【行列28 ||Ux|| = ||x||】 #181 #VRアカデミア #線型代数入門
Просмотров 1,8 тыс.
12:45
【強化学習】全体像を見据えておこう【2つのループが特徴】RL vol. 3 #153 #VRアカデミア #ReinforcementLearning
Просмотров 10 тыс.
00:55
Почему Бондарчуки бросили дочь с ДЦП? Полный ролик в VKвидео #психология #дцп #дцпдети
Просмотров 127 тыс.
00:47
Random Emoji Beatbox Challenge #beatbox #tiktok
Просмотров 8 млн
40:03
МЖ. Может, папа - ты? 16.02.2023
Просмотров 204 тыс.
01:00
Как получить игры БЕСПЛАТНО? Нужен ПРОСТОЙ трюк... / #игры #gaming #булджать #rpg #2024
Просмотров 159 тыс.
9:55
【強化学習】教師あり学習とは何が同じで何が違う?【実は共通点も多い!】RL vol. 2 #152 #VRアカデミア #ReinforcementLearning
Просмотров 9 тыс.
33:04
Generative Model That Won 2024 Nobel Prize
Просмотров 166 тыс.
16:17
【強化学習】GPIと構造図 - 4つの対象の関係を図示して混乱と決別する!【強化学習は、探索と学習のループ】RL vol. 8 #164 #VRアカデミア #ReinforcementLearning
Просмотров 6 тыс.
40:51
【LIVE】Discovering Preference Optimization Algorithms with and for Large Language Models #VRアカデミア
Просмотров 2,1 тыс.
27:14
How large language models work, a visual intro to transformers | Chapter 5, Deep Learning
Просмотров 3,5 млн
53:15
強化学習と逆強化学習を組み合わせた模倣学習
Просмотров 5 тыс.
27:31
【強化学習】n-step TD 法 - 一番使われる基礎的手法だよ【強化学習の基礎アルゴリズム】RL vol. 17 #182 #VRアカデミア #ReinforcementLearning
Просмотров 2,8 тыс.
9:25
【深層学習】CNN 実装してみた【ディープラーニングの世界 vol. 7 】 #059 #VRアカデミア #DeepLearning
Просмотров 33 тыс.
31:49
【特異値分解⑦】ランダム行列と深層学習 - 勾配消失・爆発の原因の1つです!【行列30 ランダム行列と深層学習】 #186 #VRアカデミア #線型代数入門
Просмотров 2,2 тыс.
18:16
【強化学習】TD(λ) - 短期と長期の目線の合せ技。【強化学習の基礎アルゴリズム】RL vol. 18 #185 #VRアカデミア #ReinforcementLearning
Просмотров 1,3 тыс.
00:55
Почему Бондарчуки бросили дочь с ДЦП? Полный ролик в VKвидео #психология #дцп #дцпдети
Просмотров 127 тыс.