Тёмный
No video :(

Векторизация текстов для практических задач // Курс «Natural Language Processing (NLP)» 

OTUS IT Онлайн - образование
Подписаться 35 тыс.
Просмотров 1,6 тыс.
50% 1

Опубликовано:

 

29 авг 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 7   
@netarrrr
@netarrrr 6 месяцев назад
Огромное спасибо за лекцию🚀
@VsevolodT
@VsevolodT 8 месяцев назад
Крутая лекция для погружения в тему! Спасибо
@user-xj4hf4od3i
@user-xj4hf4od3i 9 месяцев назад
Потрясающе! Огромное спасибо автору!
@marwolaeth111
@marwolaeth111 8 месяцев назад
Спасибо, очень интересно! Я думал, что n-граммы - это n слов, из которых так же можно состалвять «мешок слов», рассчитывать Tf-Idf и т. д. А еще skip n-grams, когда n-граммы состалвяются не только из слов, идущих по порядку, но и имеющих между собой от 1 до k других слов. С такими токенами я раньше выделял сюжеты (инфоповоды) в корпусе новостных публикаций (RNewsflow + та самая (4:52) кластеризация графов). Для полнотекстовых новостей работало хорошо, для ретрансляций заголовков в соцсетях - неплохо, для обсуждений в блогах (вроде Telegram- и RU-vid-каналов - не очень). Главная проблема - последний пункт списка на слайде (23:52): настоящее проклятие анализа медиатекстов)) FastText, Word2Vec и BERT никогда не делал, поэтому за это всё отдельное спасибо.
@user-xj4hf4od3i
@user-xj4hf4od3i 8 месяцев назад
Поддерживаю вопрос о файле блокнота. стоит ожидать?
@alexeykazmin7539
@alexeykazmin7539 8 месяцев назад
Супер! Ссылка на блокнот colab будет?
@sndrstpnv8419
@sndrstpnv8419 4 месяца назад
pls share code
Далее
Reforged | Update 0.30.0 Trailer | Standoff 2
02:05
Просмотров 770 тыс.
버블티로 체감되는 요즘 물가2
00:15
Просмотров 1,2 млн
Reforged | Update 0.30.0 Trailer | Standoff 2
02:05
Просмотров 770 тыс.