NLP обработка текста, решение задачи классификации твитов - «Школа Больших Данных» Москва

Подписаться 6 тыс.

Просмотров 7 тыс.

50% 1

В данном видео приведен пример первой стадии решения NLP задачи классификации текстов на языке программирования Python. Приведен пример обработки текста, продемонстрирован разница алгоритмов лемматизации и стемминга.
Ссылка на код: gist.github.com/MachineLearni...
По вопросам обучения на курсах машинного обучения приглашаем в нашу "Школу Больших Данных" г. Москва
Курс проводится только в специализированном учебном центре «Школа Больших Данных» python-school.ru
По вопросам обучения на курсах машинного обучения приглашаем в нашу «Школа Больших Данных»
Обращаться по телефону:
+7 (495) 41-41-121
+7 (995) 100-45-63
Чтобы не пропустить информацию о новых курсах, акциях и других событиях Школы Больших Данных, рекомендуем подписаться на нас в социальных сетях:
Телеграм-канал: t.me/BigDataSchool_ru
Facebook: / bigdataschoolru
Вконтакте: bdschool_mck
LinkedIn: / bigdataschoolru
Twitter: / bigdataschoolr
Подписывайтесь и будьте в курсе всех интересных новинок мира Big Data вместе со Школой больших данных - www.bigdataschool.ru

Опубликовано:

18 окт 2020

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист

Посмотреть позже

Комментарии : 5

@siverska 9 месяцев назад

Классно объясняете! Спасибо! 😊 На курсе, который я прохожу, всё намного хуже.

@BigDataSchool 9 месяцев назад

Благодарим за отзыв. Приходите к нам на обучение, у нас самые лучшие преподаватели.🙂 (курс по теме видео bigdataschool.ru/courses/pnlp-natural-language-processing)

@nikolajbardukov2720 3 года назад

замечательный урок

@dblmok_ 3 года назад

Спасибо!

@user-kk6es2ou8z 10 месяцев назад

Как то все сложно. Существют гораздо более простые методы для классификации текстов, которые работают на простом JS коде в обычном броузере на основе ассоциативной семантики. Кстати, достижение критерия достоверности при классификации контента при запросах пользователей требует сохранение изначальной структуры текстов датасета. Здесь текст чистится от стоп-слов и тд, что дает не достоверную классификацию