ESTE VÍDEO (9): Nesse vídeo aprenderemos sobre a detecção de anomalias, suas aplicações e cuidados com seu mal uso.
***ERRATA: no momento 23:11 troquei alguns pontos da lógica do uso do Épsilon para identificar anomalias. Os cálculos e código estão corretos, mas a correta leitura e interpretação é a seguinte:
- Épsilon é o valor considerado como fronteira da distribuição, então:
caso a probabilidade de uma observação "x", Pr(x), seja menor que Épsilon, aquela observação é uma anomalia, tendo em vista que a probabilidade é menor que o limite esperado (Épsilon) para a distribuição daquele conjunto de dados.
Notebook com exemplo usado na aula:
github.com/jan...
Conjunto de dados:
github.com/MLR...
Referências
Géron, Aurélien (2019). Mãos à Obra Aprendizagem de Máquina com Scikit-Learn & TensorFlow: Conceitos, ferramentas e técnicas para a construção de sistemas inteligentes. Traduzido por Rafael Contatori. Alta Books.
Grus, Joel (2016). Data Science do Zero: Primeiras regras com Python. Traduzido por Welington Nascimento. Alta Books.
MathWorld. Bivariate Normal Distribution. Disponível em mathworld.wolf.... Acesso em 01 jun. 2022.
McKinney, Wes (2018). Python para Análise de Dados: tratamento de dados com pandas, numpy e iPython. Traduzido por Lúcia A. Kinoshita. Novatec.
________________________________________
github.com/MLR...
21 сен 2024