Тёмный

Como usar Clusters para encontrar padrões nos seus dados | ML do Básico ao Aplicado 

Rafinha dos Dados
Подписаться 2,2 тыс.
Просмотров 11 тыс.
50% 1

Nesse vídeo vamos falar sobre Clusters! Mas o que é isso? É quando ao invés de usar machine learning para PREVER coisas, vamos usar para ENCONTRAR PADRÕES nos meus dados.
Vamos encontrar quais clientes são mais parecidos com quais (de acordo com as variáveis que utilizarmos) e separarmos eles em GRUPOS. Tipo punks, góticos, sambistas, funkeiros, etc...
E vou te falar: Essa é uma das técnicas mais importantes em Machine Learning! Quase todo projeto acaba esbarrando em algum tipo de clusterização! E sabe por quê? Porque deixa o resultado mais FÁCIL, mais ÚTIL.
Para a empresa, tendo uma separação INTERPRETÁVEL dos clientes, ela pode definir regras de atuação, de desconto, de campanha, para cada um desses grupos. Fica mais fácil de entender o que está acontecendo, de testar, de criar equipes personalizadas em cada tipo de cliente.
Perguntas importantes que respondo nesse vídeo:
- O que é clusterização?
- Como escolher número de clusters usando o método de Elbow (gráfico de cotovelo)?
- Como INTERPRETAR seus clusters pra ver se eles fazem sentido?
- Como APRESENTAR e COMUNICAR seus clusters para as pessoas entenderem a usarem eles?
Espero que você goste! Um abraço!
#vocêcientistadedados #cientistadedados #ciênciadedados #machinelearningdescomplicado #machinelearning #inteligênciaartificial #rafinhadosdados #datascience #dataanalyst #artificialintelligence #datascientist #modelagemmachinelearning #soluçãomachinelearning #entenderoproblema #dados #satisfaçãodocliente #cluster #agrupamento #naosupervisionado #não-supervisionado #padroes #mineraçãodedados #datamining #kmeans #k-means #elbow #gráficodecotovelo

Опубликовано:

 

19 сен 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 35   
@aabner7
@aabner7 2 года назад
Eu tava procurando por vídeos de cluster e ninguém explicou tão bem como tratar variáveis categóricas e normalizar os números do cluster pra entender a proximidade de forma proporcional. Valeu demais bixo, ce me salvou!
@Luizmilare
@Luizmilare 2 года назад
Rafa, vi seu vídeo umas 10 vezes essa semana, e vc me ajudou muito com um trabalho super importante. Muito obrigado e parabéns pelo conteúdo!
@RafinhadosDados
@RafinhadosDados 2 года назад
Que bom que o conteúdo ajudou Luiz!! Fico muito feliz! :D
@biancaportela3978
@biancaportela3978 Год назад
Sensacional esse vídeo, principalmente essa parte final de interpretação dos resultados dos cluster. Vai ajudar muito no projeto que estou fazendo!
@eaetayna
@eaetayna Год назад
Que aulão!!! Cheguei agora e já virei fã! 👏🏻 conteúdo excelente e explicado de forma simples, obrigada!
@dvessoni
@dvessoni 2 года назад
Rafinha, parabéns pelo conteúdo! Vc teria referências literárias onde eu poderia encontrar utilização de K-means com variáveis dummies?
@srdouglas1026
@srdouglas1026 Месяц назад
Faz maks professor muito obrigado
@jefferson12357
@jefferson12357 11 месяцев назад
A aula ficou bastante explicativa, Gratidão pela entrega Rafinha! Tive dúvida no entendimento sobre o que agrega a pessoa em cada cluster, o que cada grupo tem em comum entre si, pq sem ter essa compreensão me parece que a informação em si, não tem muito sentido.
@claudio1417
@claudio1417 Год назад
Massa Rafa. Esse assunto é sempre muito bacana abordar. Show. Parabéns!
@marciagaleno
@marciagaleno Год назад
Que vídeo maravilhoso, adorei sua didática!
@douglaslima480
@douglaslima480 2 года назад
Boa notie, primeiramente parabéns pelo vídeo. Muito bom e muito explicativo. Tenho uma dúvida onde consigo encontrar esse notebook? e novamente parabéns explicou de uma maneira que ficou muito fácil o entendimento
@mariaeduardasantos2198
@mariaeduardasantos2198 6 месяцев назад
que didatica sensacional!
@daaggu
@daaggu Год назад
Parabéns pelo trabalho. Você pode informar seu github ou blog com todos os seus projetos?
@giulinhapo
@giulinhapo Год назад
30s de vídeo e já to: mels dels, era isso mesmo que eu precisava KKKKKKKK
@igaratensetilapias220
@igaratensetilapias220 2 года назад
"de onde eu tirei esses 8 clusters? do bumbum" kkkk
@giulinhapo
@giulinhapo Год назад
Gratidão Rafinhaaa, Deus lhe abençoe
@felipe.vilela.64
@felipe.vilela.64 2 месяца назад
Olá! Você pode me ajudar? Qual melhor modelo de machine learnig (algoritmo) para aplicar em uma base de dados que tenha uma tabela com dados da venda (cliente, data, ...) e outra tabela com os produtos vendidos (da venda). Gostaria de saber através de um determinado algoritmo os grupos de vendas com características semelhantes.
@walquiriasilva9380
@walquiriasilva9380 2 года назад
Excelente Vídeo e Didática. Parabéns.
@luizaugusto7841
@luizaugusto7841 Год назад
Vídeo incrível! Parabéns!
@claytonsilva007
@claytonsilva007 3 года назад
Excelente vídeo! Parabéns!!!!!!
@RafinhadosDados
@RafinhadosDados 3 года назад
Que bom que gostou Clayton! :D
@23bpm7rpm7
@23bpm7rpm7 3 месяца назад
sensacional sua aula! poderia disponibilizar o codigo?
@raphaelbonillo2192
@raphaelbonillo2192 3 месяца назад
Belo vídeo, hein?
@fabriciopupo_oficial
@fabriciopupo_oficial Год назад
Olá Rafinha, tem como nos passar o notebook? obrigado
@andrefelipeciccoribas6932
@andrefelipeciccoribas6932 9 месяцев назад
Excelente vídeo
@lindolphocorleta9433
@lindolphocorleta9433 3 месяца назад
sensacional!
@raphaelbonillo2192
@raphaelbonillo2192 3 месяца назад
Me tira um dúvida? Se eu quisesse usar somente as categóricas, poderia usar o OneHotEncondig e aplicar distancia cosseno?
@marianapaixao3604
@marianapaixao3604 3 года назад
muito bom!
@RafinhadosDados
@RafinhadosDados 3 года назад
Que bom que gostou, Mariana! :D
@luiza_rodrigues399
@luiza_rodrigues399 2 года назад
Mas pq você somou o valor das linhas e dividiu pelo total? No caso, vc está usando a métrica do cosseno, mas se fosse outra, poderia deixar só como dummies sem fazer essa soma e posterior divisão?
@amauryribeiro1860
@amauryribeiro1860 Год назад
tbm fiquei na dúvida, mas pesquisei em artigos e é uma boa prática pq dados mais irrelevantes ou sujos serão mais facilmente lidados pelo algoritmo. Outro coisa que aprendi foi a utilização do PCA para reduzir as dimensões antes de aplicar o k-means, que ele não fez no video., mas acredito que cada caso é um caso, e em algumas situação haverá pouca ou quase nenhuma diferença se sua base de dados for simples.
@rgiz7675
@rgiz7675 Год назад
@@amauryribeiro1860 ele não usou o Pca mas ele usou no começo uma fórmula de soma e divisão que reduz a dimensão dos dados. Funciona da mesma maneira
@robsonaugustopies
@robsonaugustopies Год назад
precisa muito do algoritmo acho que estou digitando algo errado, não esta rodando triste pra eu 😪
@robertomoreira2168
@robertomoreira2168 6 месяцев назад
alguem tem interesse em buscar padrão pra operar na bolsa?
@kleissoneduardo3898
@kleissoneduardo3898 6 месяцев назад
Ótimo vídeo