Тёмный

NLP обработка текста, решение задачи классификации твитов - «Школа Больших Данных» Москва 

Школа Больших Данных
Подписаться 6 тыс.
Просмотров 7 тыс.
50% 1

В данном видео приведен пример первой стадии решения NLP задачи классификации текстов на языке программирования Python. Приведен пример обработки текста, продемонстрирован разница алгоритмов лемматизации и стемминга.
Ссылка на код: gist.github.com/MachineLearni...
По вопросам обучения на курсах машинного обучения приглашаем в нашу "Школу Больших Данных" г. Москва
Курс проводится только в специализированном учебном центре «Школа Больших Данных» python-school.ru
По вопросам обучения на курсах машинного обучения приглашаем в нашу «Школа Больших Данных»
Обращаться по телефону:
+7 (495) 41-41-121
+7 (995) 100-45-63
Чтобы не пропустить информацию о новых курсах, акциях и других событиях Школы Больших Данных, рекомендуем подписаться на нас в социальных сетях:
Телеграм-канал: t.me/BigDataSchool_ru
Facebook: / bigdataschoolru
Вконтакте: bdschool_mck
LinkedIn: / bigdataschoolru
Twitter: / bigdataschoolr
Подписывайтесь и будьте в курсе всех интересных новинок мира Big Data вместе со Школой больших данных - www.bigdataschool.ru

Опубликовано:

 

18 окт 2020

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 5   
@siverska
@siverska 9 месяцев назад
Классно объясняете! Спасибо! 😊 На курсе, который я прохожу, всё намного хуже.
@BigDataSchool
@BigDataSchool 9 месяцев назад
Благодарим за отзыв. Приходите к нам на обучение, у нас самые лучшие преподаватели.🙂 (курс по теме видео bigdataschool.ru/courses/pnlp-natural-language-processing)
@nikolajbardukov2720
@nikolajbardukov2720 3 года назад
замечательный урок
@dblmok_
@dblmok_ 3 года назад
Спасибо!
@user-kk6es2ou8z
@user-kk6es2ou8z 10 месяцев назад
Как то все сложно. Существют гораздо более простые методы для классификации текстов, которые работают на простом JS коде в обычном броузере на основе ассоциативной семантики. Кстати, достижение критерия достоверности при классификации контента при запросах пользователей требует сохранение изначальной структуры текстов датасета. Здесь текст чистится от стоп-слов и тд, что дает не достоверную классификацию
Далее
Стас о своих клиниках
00:19
Просмотров 501 тыс.
ЛУЧШАЯ ПОКУПКА ЗА 180 000 РУБЛЕЙ
28:28
КАК ДУМАЕТЕ КТО ВЫЙГРАЕТ😂
00:29
Семинар. Обработка текста.
26:27
Стас о своих клиниках
00:19
Просмотров 501 тыс.