Тёмный

«GigaChat: наш опыт обучения LLM» 

Yandex for ML
Подписаться 2,1 тыс.
Просмотров 2,9 тыс.
50% 1

«GigaChat: наш опыт обучения LLM»
Дани Эль-Айясс, Исполнительный директор, SberDevices
Большие языковые модели (LLM) являются новым этапом развития интеллектуальных систем, решающих задачи на естественном языке. Помимо глубокого понимания структуры языка, LLM также формируют знания о мире во время обучения на больших корпусах текста, что выводит их на новый качественный уровень, открывая новые эмерджентные способности, такие как подходы, основанные на нулевом или крайне мало числе примеров (Few-Shot/Zero-Shot Learning/Prompting) и построение рассуждений (Reasoning).
Но обучение подобных моделей является сложной задачей, требующей большого количества ресурсов и тонкой настройки. В докладе мы хотим поделится нашим опытом обучения модели ruGPT-3.5 - большой языковой модели от Сбера, лежащей в основе генеративного сервиса GigaChat, начиная с предобучения и заканчивая RLHF-пайплайном.

Опубликовано:

 

5 окт 2023

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 2   
@karatemoscow
@karatemoscow 5 месяцев назад
llama2 в русском полное говно по сравнению с чатчпт
@user-gn6ml5tm8l
@user-gn6ml5tm8l 4 месяца назад
Ну а пруфы?
Далее
The idea of ​​making a badge is so cute ❤️
00:44
КТО ДОЛЬШЕ ПРОЖИВЕТ НА 10$
31:43
Просмотров 554 тыс.
[1hr Talk] Intro to Large Language Models
59:48
Просмотров 1,9 млн
Открытые модели и их обучение
1:24:44
FPGA - это не только FPGA
48:54
Просмотров 1,9 тыс.