Вадим Леонидович, простите за возможно не корректный вопрос, подскажите пожалуйста вы на данный момент времени ещё где-нибудь занимаетесь очной преподавательской деятельностью?
Вадим Леонардович, а я вас все еще иногда смотрю, в 2020ом я первый раз получил работу в DS, а сейчас уже я сделал TTS систему на иностранном языке для одного из наших тех гигантов, планирую всё-таки пойти в академию, чтобы набраться зрелости именно стать твёрдокожим, как ни крути вижу что коллеги прошедшие академию отличаются от обычных. Каждый раз я вспоминаю что именно ваши лекции, записанные в CSC Петербурга, дали мне возможность заниматься такими интересными штуками!
Вадим Леонардович, спасибо вам огромное за труды! Просто слезы счастья наворачиваются, какие на вес золота знания вы распространяете просто так, бесплатно и на русском языке. Благодаря вам поверила что все таки смогу осилить, разобраться с машинным обучением. Уже несколько лет хожу вокруг и ощупываю. У вас невероятный талант объяснять очень сложные вещи доступным языком! Моя безмерная благодарность
Вадим Леонардович, есть такой вопрос. Не по теме видео совсем, извините. Во всех топиках по ML, с которыми я разбирался, датасет дается как изначальная данность, сразу целиком. Однако, например в маркетинговых исследованиях датасет формируется постепенно, респонденты приходят на сайт и участвуют в опросе и база результатов опроса копится. У аналитика есть возможность взять предварительную базу (скажем 20% выборки), поработать с ней и по результатам работы скорректировать опросник для оставшейся выборки. А есть ли методы ML, которые решают подобные задачи, то есть как бы коррекция сбора данных в зависимости от «предварительного анализа»? Если да, то как они называются, по каким ключам их можно найти? Мой поиск не дал результатов. Не подскажите ли, исходя из Вашего опыта?
Я встречался с коррекцией опросника по ходу опроса в совместном анализе (conjoint). Но это было реализовано в дорогих специализированных пакетах. Если же Вас волнует репрезентативность выборки, когда добираются респонденты из определенных сегментов, то это есть, но Вам это не доступно, клиенты сами приходят на сайт... Я бы на Вашем месте не заморачивался, а организовал 5 отдельных исследований, после каждых 20% выборки.
@@Vadim_Abbakumov Вадим Леонардович, спасибо за ответ, но мой вопрос был про более распространенные виды исследования, нежели конджойнт. И "заморачиваться" имеет смысл, так как каждый день опроса и каждый респондент - это бюджет. Возможно ли написать Вам вопрос на электронную почту? Так как писать его под видео не очень в тему... Буду очень благодарен, если такая возможность найдется
Вадим Леонардович, как Вы считаете, есть ли смысл при обучении модели с рандомизацией (например, RF) выбирать наблюдения, предварительно их кластеризовав и формировать подвыборку с учетом принадлежности к кластерам? Суть в том, чтобы обеспечить максимальную "равномерность" подвыборки.
Я бы строил отдельную модель для каждого кластера. Возможно Вы имели в виду стратифицированное расщепление на фолды. Это разумно, рекомендуется так и делать.
Спасибо Вам за прекрасную работу! Это самый понятный материал из всех, которые я видел! Теперь я понял в деталях как оно работает! Буду мечтать, чтобы Вы материал сняли про Affinity Propagation! 😊
Расскажите пожалуйста больше о самом курсе. Будет ли весь курс выложен на ютубе? Курс будет представлять из себя только видеозаписи или есть сопровождающий сайт? А может курс будет выложен на какой-то платформе, а тут только частично? С какой периодичностью планируете выкладывать?
1. Если ютуб не запретят, то весь и на ютубе. Когда запретят, перееду, скорее всего на рутуб. 2. Сопровождающего сайта нет (а зачем?). Но архивы с материалами будут выложены на яндекс диске. 3 Выкладываю по готовности, быстро не получается...
Добрый день, подскажите как бороться со следующей проблемой. Есть база клиентов, и поведенческие аггрегированные признаки. Имеется куча признаков, ну пусть 5000. Я убрал признаки с пропусками, коррелируемые признаки, выбросы. Все, осталось ну пусть 800. Получилось 6 кластеров, которые непонятно как интерпретировать. Есть 1-2 ну хоть как то отличающихся кластера, остальные похожи. Нам важна именно интерпретация. Тут рецепт только фильтровать признаки? Или разделить их на группы и с каждой группы взять по 1 наиболее значимому с экспертной точки зрения ? Или идти по пути сокращения размерностей ?
Спасибо. ARIMA будет, но до нее длинный путь... prophet, ML модели для прогнозирования, экспоненциальное сглаживание. Прошу подождать, быстро у меня не получается.
Я заменил (в примере) "индийский" код : if a.count('s') == 5: count_ += 1 if a.count('h') == 5: count_ += 1 if a.count('d') == 5: count_ += 1 if a.count('c') == 5: count_ += 1 на (эквивалентный ?) if a.count('s') == 5 or ('h') == 5 or ('d') == 5 or ('c') == 5: count_ += 1 Остальной код оставил без изменения. Оценка вероятности получилась другой. ? Что тут не так? Спасибо!
Спасибо за очередную порцию удовольствия! Прекрасный метод подачи материала (во всех лекциях) - начинаешь понимать, откуда "ноги" растут, почему они местами кривые, не на тех пошел, не туда... Если шире, то хорошая аналогия из "Черный лебедь". Оттуда, большинство в мире - "платоники", которые всегда точны, но не верны (вероятно, исходят из совершенства мира), тогда как истина не точна и ее поиск и приближение к ней заключается в подвергании ее постоянному сомнению. Здесь все хорошо:).
Статистическую теорию в массы! Элементарные вещи становятся супер-пупер анализом типа дата-саинес. Питон - великое наебалово масс бездарных в математике. Еще пару-тройку лет подержится, потом грохнется. Если вы бездарность - флаг в рука, остальным - плевать в спину этим барабанщикам.
Замечательный цикл лекций. Есть глубина, есть широта, есть простота. И как хорошая музыка - все гармонично. И ничего лишнего. Прекрасно. Спасибо большое! И вопрос. Это большой труд. Мне как то неудобно этим пользоваться безвозмездно и, как жизнь показывает, без логичной обратной связи это все не долго продолжается, а у Вас такой опыт, плюс дар донести, хотелось длительного продолжения. Я не к тому, что надо, как сейчас принято "монетизировать ресурс", просто наличие различных вариантов сказать спасибо. ?
Спасибо за высокую оценку. Запретят youtube, буду монетизировать на rutube или в VK. Пока же меня в газпром-нефть неплохо кормят. А если Вы будете рекомендовать мой курс и канал знакомым, буду благодарен.