Тёмный
Takami Sato (tkm2261)
Takami Sato (tkm2261)
Takami Sato (tkm2261)
Подписаться
Kaggle: www.kaggle.com/tkm2261

Twitter: twitter.com/tkm2261

Github: github.com/tkm2261

Linkedin: www.linkedin.com/in/takami-sato-3292168a/

Slideshare: www.slideshare.net/tkm2261/
Комментарии
@saitama9503
@saitama9503 4 месяца назад
( ..)φメモメモ >> 1:00:19 公開カーネル そのまま使うことは無い 手元の環境に移植して、自分のバリデーション手法で有意性を確かめてから使用する ->ローカルCVでの改善が見られない場合、パブリックが怪しい可能性がある >> 1:02:39 特徴量の生成は最後(!?) 問題の解き方とバリデーションの構築、パブリックの信憑性など、 特徴量生成以外のタスクが完了したと判断したあたりで提出を始める >> 1:03:49 パブリックの疑い方 リーダーボードのスコアがテストデータの何%で算出されるのかを手元で再現するのは簡単 (グループk-foldなのか、比なのか等) 手元のスコアのブレを見る 公開ノートブックを自分のバリデーションでチェックして、パブリックスコアを再現するか >> 1:18:58 あまりにも違う商品の予測の場合、モデルを分割しても精度が大きく変化しない場合がある 予測対象が多岐にわたる場合、複数のモデルを組合わせても効果的 問題分割は効果的 例:0か否かをRnadomForestで予測して、0でない場合にPyTouchで学習させる >> 1:24:00 XGBoostとlighGBMでチューニングの勘所が異なる XGBoostの方が時間がかかるが精度が高くなる感覚を持っている (XGBoostをC++で再実装(!?)してアルゴリズムを理解しているため) >> 1:26:00 XGBoostとlighGBMでデフォルトbinの切り方が違う XGBoostのhistほにゃららでlightGBMと同じ切り口になる bin = 分岐 はツリー系の肝 >> 1:31:40 時系列コンペ テストデータの期間は手元に無いので、手元のデータで代用する 期間の切り方、同じ期間でのランダムサンプリングの違いによる手元のスコアの変動 手元のスコアのぶれのヒストグラムを見て、パブリックスコアの信頼性を確かめるのが大事
@saitama9503
@saitama9503 4 месяца назад
なるほどなあ。 kagglerは企業・団体がデータセットをより上手く扱うお手伝いをしていることになるのね。 >> 1:27:06 Q ある論文がkaggleに役立つか否かを早期に見極める方法は? A 自分が詳しいデータセットを使用している論文は見極めやすい データセットの特徴(不均衡) タスクの種類・難易度 訓練データセットとテストデータセットの分布(同じ分布か?) ->どうやったらデータセットに詳しくなるか? A 手を動かすしかない -> 主催者がデータセットの分析に迷っているのでkaggleに提供しているとも言える >> 1:31:32 Q kaggleの楽しいところは? A 普段接点の無いところのデータセットに触れることができる(想像力が掻き立てられる) White house Passenger screening A 知らない分野のデータを見るのは楽しい A さまざまなバックグラウンドを持つ人たちとチームを組める
@てぃたな-k5q
@てぃたな-k5q 5 месяцев назад
字幕が少し見づらいです
@kaj694
@kaj694 9 месяцев назад
実行時間の把握の仕方すごい
@男団子-x5t
@男団子-x5t Год назад
VOCALOIDはヤマハの製品の方だからずんだもんはボカロではないけど,内容はめちゃめちゃ参考になった
@okkotonushi-desu
@okkotonushi-desu Год назад
他にない動画でとても参考になりました。 何を考えて何を試したのかが論理的に解説されていたのでとても良かったです。 しかも2位入着の方となると説得力がありますね!
@nocchi5550
@nocchi5550 2 года назад
おつかれさまでした!
@野菜おいしい-y4t
@野菜おいしい-y4t 2 года назад
徳川家康もグーグルのアカウント作るときこんな感じだったのかな~
@hamuhamu3625
@hamuhamu3625 2 года назад
いやー、まじで勉強になります・・・ ところで、三分間クッキング方式の説明はどこかにありますか?
@hamuhamu3625
@hamuhamu3625 2 года назад
10:50 なるほど。。 強い人って論文までちゃんと読んでるイメージだった。。
@ことらいん
@ことらいん 2 года назад
LB Probing存在は知ってたけど、参加したコンペで実践例を見ると、かなり効果的だったことに驚きました この動画参考にして自分も試してみます! (追記:3000人おめでとうございます🎉)
@Goko256
@Goko256 2 года назад
Kaggle上でも環境を切り替えることはできるのでしょうか? コピーしたカーネルが動かないことが多々ありまして...
@innocentivashin
@innocentivashin 2 года назад
画像コンペ(や大きなデータを扱うコンペ)におけるgitでのデータ管理の話、もう少し詳しく聞きたいです!
@ねじ-l4p
@ねじ-l4p 2 года назад
計算資源が乏しいと、学習の待ち時間が長いので、今回のように待ち時間にやっていることも見せてほしいです!
@nocchi5550
@nocchi5550 2 года назад
ありがとうございます!
@nocchi5550
@nocchi5550 2 года назад
編集&アップありがとうございます! めちゃ勉強になります!
@nocchi5550
@nocchi5550 2 года назад
「カグルの試行の大半はスコア改善に役立たない」←上位の方々は、最初からリーダーボードの上の方にいるイメージがありましたが、 こういった裏側の地道にトライ&エラーをしている部分がみれて、とても勉強になりました。
@user-pw9yg8yt7h
@user-pw9yg8yt7h 2 года назад
みぞれもん!
@poccopoco9167
@poccopoco9167 2 года назад
コーディング中の動画も勉強になります!
@rajneeshtiwari5459
@rajneeshtiwari5459 2 года назад
No English subs 😔
@hyyhaaaaa
@hyyhaaaaa 2 года назад
3090いいなあ。特に画像コンペだとGPUの差でぶん殴られる…
@nocchi5550
@nocchi5550 2 года назад
ありがとうございます!
@ことらいん
@ことらいん 2 года назад
環境設定分からなくて、今までkaggle上でずっと作業してたけど、この解説動画見ながらなら環境設定に挑戦できそう…!
@TK210621
@TK210621 2 года назад
最近kaggleを始めたばかりの初心者です!Part3以降の動画楽しみにしてます
@ano5041
@ano5041 2 года назад
Kaggle + ずんだもんという俺得な組み合わせ しかも投稿主さんが信頼できるお方
@MN-jv9mg
@MN-jv9mg 2 года назад
参考になります!ありがとうございます!
@ph4746
@ph4746 3 года назад
6:25 辺りのtargetを入れるとゴリゴリ過学習してしまうというのはどういうことでしょうか?👀
@ph4746
@ph4746 3 года назад
18:33 ParameterGridとGridSearchCVってどう違うのでしょうか?
@ph4746
@ph4746 3 года назад
predict_proba(X)は挙動おかしいことあるから代わりにdecision_function(X)使った方がいいですよーみたいな話ありますがどうなんでしょう?
@AIxCE
@AIxCE 3 года назад
勉強になります! 英語読めて羨ましいです!
@rajneeshtiwari5459
@rajneeshtiwari5459 3 года назад
Wish if you could so some of these in English.
@takamisato4299
@takamisato4299 3 года назад
That's a good idea. I welcome you to join our zoom. I think some of us, at least me, can speak English. Since my main subscribers are Japanese, English-only live might be hard....
@rajneeshtiwari5459
@rajneeshtiwari5459 3 года назад
@@takamisato4299 how about English subtitles? I am not sure if youtube can auto generate those.
@GB-kx5gb
@GB-kx5gb 3 года назад
おもろ笑
@taiyosuzuki2637
@taiyosuzuki2637 3 года назад
Pycharmで、普通に回せるのですが、仮想環境をつくるいみってなんでしょうか?
@ときわの備忘録
@ときわの備忘録 3 года назад
59:57
@fryng_pan
@fryng_pan 4 года назад
16:00 開始(大体)
@nobo1595
@nobo1595 4 года назад
めっちゃわかりやすい、これからもkaggle関係の動画あげてほしい。
@kyoheikainuma8721
@kyoheikainuma8721 4 года назад
pikleで呼び出しているファミリー毎の最小コストは算出する式のみでしょうか、また出力形式(行列・縦持ちデータ)?はどんな形をとっていますか?的外れだったらごめんなさい。
@MrDivar
@MrDivar 4 года назад
Eng. Sub Please? Tnx
@MrDivar
@MrDivar 4 года назад
Hi Takami, I am waiting for several months to watch this part with the Eng Sub!
@naotanaotan
@naotanaotan 4 года назад
丁寧な解説ありがとうございます。非常に参考にしております。 20:00〜21:15あたりにターミナルに、何というコマンドを打ち込んでいるのか教えていただけるとありがたいです。
@takamisato4299
@takamisato4299 4 года назад
ただ単にSSHの公開鍵をクリップボードにコピーしようとしているだけです。(失敗してますが) pbcopyはmac用のコマンドなので調べて頂ければ。
@alken00000
@alken00000 5 лет назад
良い説明していると思いますが、コードは良く見えない、スクリーンをズームインしてくれば助かります。
@takayukiyagi5506
@takayukiyagi5506 5 лет назад
難なくgcp入門できました!ありがとうございます!
@skn717
@skn717 5 лет назад
ものすごく参考になりました!!!
@tamago9760
@tamago9760 5 лет назад
参考になりました!ありがとうございます。
@山登-w9m
@山登-w9m 6 лет назад
サンタクロースのプレゼントで子供が幸福になれるのなら!安倍晋三の憲法改正でも国民は幸福になれそうだけど?純粋にKaggleのコンペとして議論しても罰は当たらないと思うケドね?方程式で憲法改正を議論しよう!
@山登-w9m
@山登-w9m 6 лет назад
安倍晋三が国民約一億人に有限の憲法改正案を提示すると国民の幸福感が一意に定まる関数が在ると仮定して。Kaggleでコンペしてくれないかな?憲法改正も国民の幸福関数で議論できるようになったら良いな!\(^o^)/
@Dkenzo1122
@Dkenzo1122 6 лет назад
emacsの拡張機能ファイル(静的解析や補完機能)はGCP上のどの場所に入れているんですか?
@daicyama-
@daicyama- 6 лет назад
ご丁寧な説明大変助かっています! emacsもvimも得意ではないのですが、AtomやVisualStudioCodeなどでGCP上のファイルを編集する方法はありますか?
@ninniku119
@ninniku119 6 лет назад
これはkaggleだけでなくgitやemacsやunixなども学べる超お得講座… emacsを使うのです…
@xela010894
@xela010894 6 лет назад
pls english subtitles thanks