Тёмный

Экономия железа для МЛ-моделей в продакшен 

Evrone Development
Подписаться 9 тыс.
Просмотров 811
50% 1

Подписывайтесь на наш канал здесь и в телеграмм t.me/meetups_evrone, чтобы быть в курсе будущих митапов и не пропускать полезные доклады!
Олег Бугримов / Авито
00:00 - Введение
00:34 - МЛ требует много железа
01:06 - Почему важно время ответа?
01:44 - Давайте купим ещё железа
02:03 - Наше решение: давайте держать как можно больше РПС
02:51 - Как мы это делаем?
04:04 - Разбиваем модели на этапы
06:20 - Добавляем батчирование
08:32 - Добавляем шаренную память
09:50 - Локи на шаренную память
10:56 - Быстрый перескок между шагами по условию
13:45 - Приоритетная обработка запросов
16:31 - Где взять Aqueduct?

Наука

Опубликовано:

 

20 июн 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии    
Далее
Этот Малыш Маленький Гений 👏
00:25
AYAYA PAPAYA 😝
00:14
Просмотров 1,6 млн
КАК РАБОТАЕТ БРАУЗЕР?
45:23
Просмотров 121 тыс.
BB1: Be Brave, Show Your CV [eng subs]
1:08:35
Просмотров 22 тыс.
Что такое опционы? [Veritasium]
30:09
Просмотров 457 тыс.
Поворот смартфона ↩️
0:32
Просмотров 46 тыс.
Asus  VivoBook Винда за 8 часов!
1:00
Просмотров 366 тыс.
AI от Apple - ОБЪЯСНЯЕМ
24:19
Просмотров 128 тыс.