ML-Workout

19
12 804

Cześć! Z tej strony Marcin i Wojtek - w naszej serii RU-vid ML-Workout omawiamy tematy związane z uczeniem maszynowym i sztuczną inteligencją. Sami jesteśmy inżynierami-praktykami i przedstawiamy zagadnienia z ML/AI z perspektywy wdrożeniowej. Zapraszamy!

Комментарии

@MateuszSzewczyk-dw4le 21 день назад

Czy wykorzystanie tutaj SMOTE dla polepszenia metryk ma sens? Czy w tym przypadku klasy są jeszcze wystarczająco zbalansowane żeby tego nie wykorzystywać??

@SZEFMACIEJ 23 дня назад

Super materiał!

@MateuszSzewczyk-dw4le 23 дня назад

NIE PODDAWAJCIE SIE I NAGRYWAJCIE PROSZE!! Brakuje czegos takiego na polskim YT, i oczywiscie ze zasiegi beda niskie bo takich nerdow jak my nie jest za wiele!! <3

@ml-workout 23 дня назад

Dzięki, miło nam!

@MateuszSzewczyk-dw4le 23 дня назад

Z NIEBA MI SPADLISCIE!

@ml-workout 23 дня назад

Dzięki ;)

@wisniowabron2253 29 дней назад

zajebista koszulka Pana po prawej

@ml-workout 18 дней назад

Pan po prawej bardzo dziękuje! :D

@BanneQ Месяц назад

Pytorch

@BanneQ Месяц назад

Świetny film, dzięki wam duzo sie ucze :) pozdrawiam i czekam na nastepne filmy!

@ml-workout Месяц назад

Super, miło nam to słyszeć - dzięki! :)

@marekbaszczak5627 Месяц назад

Jak zwykle super, konkretnie, z kodem i teoria! :). Co do metryki to F1 score, ale tez można użyć wartości pola pod krzywą Precision-Recall :D

@ml-workout Месяц назад

Dzięki! Super pomysł z metrykami 💪🏻

@piotrec24 Месяц назад

F1?

@ml-workout Месяц назад

tak, dokładnie! :)

@jakubmalin-dr8pi Месяц назад

Super

@ml-workout Месяц назад

dzięki! :)

@Cisi204 Месяц назад

Chłopaki częściej, więcej poproszę :)

@ml-workout Месяц назад

dzięki, bardzo nam miło to słyszeć! :)

@marekbaszczak5627 2 месяца назад

Fajny odcinek! :) Zrobicie odcinek o trochę starszych modelach embeddingowych - np. GloVE, Word2Vec, fastText?. Takie embeddingi są też przydatne gdy chce się szybko stworzyć swój model embeddingowy oparty o nasze teskty domenowe :)

@ml-workout 2 месяца назад

Dzięki za komentarz! Zobaczymy jaki będzie odzew, wtedy może taki odcinek nagramy 🙂

@tomaszzielonka9808 2 месяца назад

Panowie, a co z tuningowaniem hiperparametrów modeli? Czy te regressory pracują na ustawieniach defaultowych np. z scikit-learn, czy można stworzyć jakiś pipeline, który wykorzysta np. GridSearch CV, czy Optuna? Chyba, że jest opcja importu wytrenowanego wcześniej w notebooku modelu (zapisanego później przez joblib, czy pickle)? W materiale gdzieś się przewinęła metryka R^2 = c. 0,46 a to sygnał, że nad modelem trzeba popracować. P.S. Bardzo fajne wprowadzenie w temat - dzięki!

@ml-workout 2 месяца назад

Dzięki za komentarz! Oczywiście, że można stworzyć pipeline, który wykorzysta GridSearcha czy Optunę 👍🏻 Jest również opcja importu wytrenowanego wcześniej modelu. Co do metryki R^2 - oczywiście model wymagałby poprawienia - nasz materiał skupia się na tutorialu Kedro, nie na modelowaniu.

@dominikxvshshbxhwj 2 месяца назад

Fajnie wyjaśnione. Zadziała to dla dokumentów w języku polski? Będzie duży spadek jakości?

@ml-workout 2 месяца назад

To zależy oczywiście od zastosowanych modeli. Do embeddingów (czyli dla cześci retrieval) jest kilka modeli dla języka Polskiego, m. in Silver Retriever ( huggingface.co/ipipan/silver-retriever-base-v1.1 ). Zawsze warto zerknąć na MTEB Leaderboard na Huggingface - jest tam zakładka dedykowana dla języka Polskiego. W kontekście generowania odpowiedzi, modele od Open AI potrafią generować odpowiedzi po Polsku z odpowiednim promptem, ostatnio pojawił się również model "Bielik" od Speakleash ( huggingface.co/speakleash/Bielik-7B-Instruct-v0.1 ). W skrócie - trzeba przetestować samemu, bo wszystko zależy od use-case'u 🙂

@etaosin 2 месяца назад

wow. Super, czyli nie ma co kopać się z ML Appla na iOS?

@ml-workout 2 месяца назад

Hej! Dzięki za komentarz! Oczywiście odpowiedź brzmi "to zależy" 🙂 Od czego? Od modelu, od czasu który chce się poświęcić na development i deployment, od wymagań biznesowych.

@WujekCameyz 2 месяца назад

To jest tak hermetyczna wiedza że taki materiałem nie traficie do szerszej publiki, proponuję bardziej publicystyczne materiały z dozą humoru. trzymam kciuki za pełen sukces, w przypadku zagwozdek montażowych służę pomocą 💪

@ml-workout 18 дней назад

dziękujemy! :)

@kasiakusznierczuk 2 месяца назад

Trochę bałam się konkurować i przegrać z pięciolatkiem, ale daliście radę XD dobry materiał!

@ml-workout 2 месяца назад

Dzięki 🫶🏻 M.

@mishatubyla 2 месяца назад

Mega spoko odcinek - dobrze wyjaśnione chłopacy :> Śmieszki z was!

@ml-workout 2 месяца назад

staramy się :D

@przemkecovers 2 месяца назад

Zajebiscie wyjaśnione 😮🫡

@ml-workout 2 месяца назад

dzięki! :)

@bandittt 3 месяца назад

Więcej, więcej :)! Dzięki Panowie za bardzo merytoryczny materiał.

@ml-workout 3 месяца назад

Dzięki - będziemy pracować nad kolejnymi materiałami z tego obszaru! :)

@janchocyk1911 4 месяца назад

tensorflow :D

@janchocyk1911 4 месяца назад

Mega ciekawy materiał ;-) Bardzo chętnie zobaczę cz. 2 o deploymencie!

@ml-workout 3 месяца назад

dzięki! :)

@tomaszwilinski3684 4 месяца назад

Chcemy dalszych części o MLflow! :)

@ml-workout 4 месяца назад

Super! Mamy już nawet parę pomysłów! :)

@janbinkowski7537 4 месяца назад

Jak zwykle - dobry, merytoryczny materiał!

@ml-workout 4 месяца назад

dzięki! :)

@user-qe1li7ou7o 4 месяца назад

PyTorch!

@MikeManPL555 4 месяца назад

Nic tylko podziękować za świetne wprowadzenie - dzięki !

@ml-workout 4 месяца назад

Dzięki! Miło czytać takie komentarze!

@TheZapalsky 5 месяцев назад

fajny nowy format :)

@ml-workout 5 месяцев назад

dzięki! :)

@user-mz1fw4tj2u 5 месяцев назад

PyTorch ^^

@user-mz1fw4tj2u 5 месяцев назад

PyTorch ^^

@mishatubyla 5 месяцев назад

Mega flow! :>

@jacekmikolajczyk6661 5 месяцев назад

PyTorch😃

@TheQueenMorrison 5 месяцев назад

Pytorch

@szymondrejewicz 5 месяцев назад

Tensorflow 🙃

@hiiamlawliet480 5 месяцев назад

Theano

@ml-workout 5 месяцев назад

Sprytnie :D

@hiiamlawliet480 7 месяцев назад

super!

@ByJacobPL 7 месяцев назад

GPUski :D

@jacekmikolajczyk6661 7 месяцев назад

GPUski😊

@Sacra. 7 месяцев назад

💪🤓

@ml-workout 7 месяцев назад

FYI: Notebook który pokazujemy na filmiku można pobrać zapisując się do naszej listy mailowej! 🔥 Link: ml-workout.pl/int8 PS. jeżeli jesteś już na naszej liście mailowej, a nie masz dostępu - odezwij się do nas na news [at] ml-workout.pl

@mirus9366 8 месяцев назад

Świetny materiał :D Ogólnie lubię moje studia, ale akurat zajęcia, które ocierały się o te tematy były bardzo źle przeprowadzone i raczej zniechęcające, ale Wasz materiał mega zainteresował mnie tym tematem :D

@ml-workout 8 месяцев назад

Dzięki! Bardzo nam miło to słyszeć :) Polecamy się na przyszłość! :D

@dpeees 8 месяцев назад

Za Alfę +2 ;)

@ml-workout 8 месяцев назад

dzięki! :)

@michabrus3333 9 месяцев назад

Znowu bardzo fajny odcinek ❤. Na pewno przerobię sobie cały tutorial ze strony kedro na spokojnie. Przy okazji, mogę zapytać z jakiego terminala korzystacie?

@ml-workout 9 месяцев назад

iTerm 2 🙂 wielkie dzięki za komentarz!

@alien1416 9 месяцев назад

wow, szacun za materiał

@michabrus3333 9 месяцев назад

Zajebisty odcinek ❤

@ghs7233 10 месяцев назад

Może warto lepiej się przyjrzeć (tzn, instalacja, wymagania itp) bibliotece cuDF? Porównywalna wydajność do polars w kodzie wystarczy zmienić "import pandas as pd" na "import cuDF as pd" 🙂 Nie trzeba tracić czasu na testowanie/naukę nowej konstrukcji metod

@baron_truskawek 10 месяцев назад

Super tutorial! Mam w pracy manuale do projektów zapisane w PDF-ach. Czy można przetworzyć informacje z takiego źródła i wczytać je do bazy wiedzy?

@ml-workout 10 месяцев назад

Dzięki za komentarz, miło nam ☺ Odpowiadając na Twoje pytanie - oczywiście że tak! Można taki scenariusz zrealizować również z LangChainem (zerknij na document_loaders/pdf w ich dokumentacji).

@dannygamble3659 10 месяцев назад

'Promo sm' 🎉

@damianhorna 11 месяцев назад

Komentarz taktyczny 😀

@jedrzejszczepaniak1661 Год назад

Do pewnego stopnia zgadzam się z tym szukaniem gwoździ, ale jeśli pomyślę sobie o swoich pomysłach gdzie - algorytmicznie nawet się za coś nie brałem, bo wydawało mi się to zbyt skomplikowane - No to teraz mam coś co pozwala mi posypać troszkę magii tu czy tam. No i to szukanie gwoździ to naturalny process przy takich przełomach. Wydaje mi się, że ludize spróbują użyć LLM dosłownie do wszystkiego i potem dopiero się zorientujemy, że niektóre rzeczy nie maja sensu - ale być może okaże się, że LLM pokaże, że jakieś problemy da sie faktycznie rozwiązać - i zespoły będą szukać tańszych rozwiązań. Dzięki za odcinek!

@ml-workout Год назад

Dzięki za komentarz! Również obserwujemy bacznie co się będzie dalej działo z LLMami 🤞🏻

@Lukiteq Год назад

U mnie ten czat strasznie się zacinało. Zogowalem się wczoraj a czat odpowiada np w punktach ale na każdy punkt wyświetla tylko po jednej literce luz wyrazie i przechodzi do następnego. Jak mu kliknę aby jeszcze raz odpowiedzial to wtedy znowu się zacinało ale na pierwszym zapytaniu na pierwszej zakładce już jest cały tekst. Dlaczego tak się dzieje? Kolega w pracy również dzisiaj się zarejestrował i jemu działa normalnie. Hmm