MetaFormer is Actually What You Need for Vision

Why Does Diffusion Work Better than Auto-Regression?

When You Get Ran Over By A Car...

Приехал покупать BMW M3 GTR из NFS Most Wanted, а оказалось…

The last one surprised me! 👀 🎈

What is your IQ : Painting color Catnap puzzle game #6 #puzzle #colorgame #coloring #paint

ConvNet beats Vision Transformers (ConvNeXt) Paper explained

Soroush Mehraban

Подписаться 3 тыс.

Просмотров 1,4 тыс.

50% 1

Видео Поделиться Скачать Добавить в

The paper presented at the 2022 Conference on Computer Vision and Pattern Recognition (CVPR) details a newly proposed architecture that adopts the design principles of Swin Transformers but replaces them with convolutions to achieve superior performance. In essence, the authors propose a Convolutional Neural Network (ConvNet) architecture that outperforms Swin Transformers while still following the underlying design principles.
Paper link: arxiv.org/abs/2201.03545
Table of Content:
00:00 Introduction
01:09 Training Techniques
01:40 Data Augmentation
04:27 Label Smoothing
06:39 Changing stage compute ratio
08:11 Changing stem to "Patchify"
09:20 ResNeXt-ify
11:11 Inverted Bottleneck
12:57 Larger Kernel Sizes
15:19 Micro Design
19:39 Making it scalable
19:48 Result
Icon made by Freepik from flaticon.com

Опубликовано:

30 июн 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист

Посмотреть позже

Комментарии : 16

@nadhembenhadjali9063 3 месяца назад

Nice explanation ! thank you so much !

@williamashbee 7 месяцев назад

You're clearly very knowledgeable on these topics. Hopefully your channel blows up. 😊

@soroushmehraban 7 месяцев назад

Thanks for the kind words! Hopefully I’ll post better videos in future.

@buh357 4 месяца назад

This modified resent has same architecture as efficientnet. Depth wise convolution, inverted block.

@phattailam9814 Год назад

Thank you very much. This is very helpful

@soroushmehraban Год назад

Glad you liked it

@user-ui5dg3nr3r Месяц назад

usefull

@az-vv3mg Год назад

Great video thanks.

@soroushmehraban Год назад

Glad you enjoyed!

@duongbinh23 Год назад

Love your content

@soroushmehraban Год назад

Thanks!

@suesarnwilainuch8429 5 месяцев назад

deformable convolution and attention please🔥

@soroushmehraban 5 месяцев назад

I read those papers and prepared slides almost a year ago. I will post a video about them if I couldn't find anything more interesting 🙂

@alihadimoghadam8931 Год назад

🤘❤

@deepsingh274 Год назад

Hey your content is very good. Can i connect with you?

@soroushmehraban Год назад

Thanks! Sure my LinkedIn name is same as my channel name.

Далее

MetaFormer is Actually What You Need for Vision

10:59

MetaFormer is Actually What You Need for Vision

Просмотров 866

Why Does Diffusion Work Better than Auto-Regression?

20:18

Why Does Diffusion Work Better than Auto-Regression?

Просмотров 209 тыс.

When You Get Ran Over By A Car...

00:15

When You Get Ran Over By A Car...

Просмотров 3,7 млн

Приехал покупать BMW M3 GTR из NFS Most Wanted, а оказалось…

49:29

Приехал покупать BMW M3 GTR из NFS Most Wanted, а оказалось…

Просмотров 404 тыс.

The last one surprised me! 👀 🎈

00:30

The last one surprised me! 👀 🎈

Просмотров 3,8 млн

What is your IQ : Painting color Catnap puzzle game #6 #puzzle #colorgame #coloring #paint

00:14

What is your IQ : Painting color Catnap puzzle game #6 #puzzle #colorgame #coloring #paint

Просмотров 2,9 млн

ConvNeXt: A ConvNet for the 2020s | Paper Explained

40:08

ConvNeXt: A ConvNet for the 2020s | Paper Explained

Просмотров 17 тыс.

The Full Evolution of Convolutional Neural Nets explained!

21:38

The Full Evolution of Convolutional Neural Nets explained!

Просмотров 614

CNN Receptive Field | Deep Learning Animated

10:28

CNN Receptive Field | Deep Learning Animated

Просмотров 1 тыс.

SHViT (CVPR2024): Single-Head Vision Transformer with Memory Efficient Macro Design

22:26

SHViT (CVPR2024): Single-Head Vision Transformer with Memory Efficient Macro Design

Просмотров 456

ConvNeXt: A ConvNet for the 2020s - Paper Explained (with animations)

19:20

ConvNeXt: A ConvNet for the 2020s - Paper Explained (with animations)

Просмотров 20 тыс.

DINO: Self-Supervised Vision Transformers

21:12

DINO: Self-Supervised Vision Transformers

Просмотров 2,2 тыс.

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

16:51

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

Просмотров 60 тыс.

Mamba: Linear-Time Sequence Modeling with Selective State Spaces (Paper Explained)

40:40

Mamba: Linear-Time Sequence Modeling with Selective State Spaces (Paper Explained)

Просмотров 130 тыс.

Kolmogorov Arnold Networks (KAN) Paper Explained - An exciting new paradigm for Deep Learning?

17:05

Kolmogorov Arnold Networks (KAN) Paper Explained - An exciting new paradigm for Deep Learning?

Просмотров 43 тыс.

ConvNeXt: A ConvNet for the 2020s

11:19

ConvNeXt: A ConvNet for the 2020s

Просмотров 5 тыс.

When You Get Ran Over By A Car...

00:15

When You Get Ran Over By A Car...

Просмотров 3,7 млн