Obejrzałem już kilka materiałów video Jakuba dot. różnych komponentów i wszystkie bardzo mi się podobało zarówno pod względem doboru zakresu materiału, sposobu przekazywania wiedzy i użytych przykładów. Bardzo dziękuję. Świetna robota! 👍
Cześć ! Używasz vim czy neovim? Czy jest jakiś sprytny sposób na dodanie copilot to vim/neovim? Jam używam obecnie vscode ale zaczęlo mi zwalniać na laptopie bo mam potężny system katalogów i on to chyba przeszukuje przy podpowiedziach. Zastanawiam się nad przejściem na vim/neovim bo wygląda bardzo dobrze a vi to moja druga natura. Pozdrawiam serdecznie!
Super! Już myślę jak zaimplementować to w jednym z projektów, bo byłby to niezły gamechanger. Jak baza zachowa się gdy zapytasz o informacje której nie ma w bazie? Zwróci 0 rekordów? Przykładowo "jak ma na imię pies Mateusza?"
Baza danych niestety ZAWSZE zwraca wynik. Po prostu będzie to wynik najbardziej prawdopodobny. Gdybym limit ustawił np. na 2, otrzymałbym prawdopodobnie w odpowiedzi imię psa Adama i info o tym, że Mateusz robi dobre memy. Nie za bardzo jest szansa na zbudowanie zapytania, które nic nie zwraca.
Problem to się robi wtedy gdy zadasz pytanie ale dostaniesz błędną odpowiedź. I szukaj wtedy "dlaczego" dostajesz błędną oraz jak to poprawić... powodzenia.
Musisz znać podstawy dowolnego języka programowania umożliwiającego Ci korzystanie z sieciowych API (kursanci najczęściej wybierają JavaScript, Pythona i DotNeta) oraz musisz umieć pracować z plikami JSON (tworzyć je, parsować itp). Masz 2 tygodnie na zwrot kursu po jego rozpoczęciu, więc możesz go przetestować bez ryzyka.
Chciałem dopytać dlaczego akurat qdrant? Ze względu na prostotę, czy są jakieś inne powody wybrania go do demo? I pytanie nr2: czy w AI Devs będziecie uczyć pracowania waśnie z qdrant-em czy z różnych wektorowymi bazami danych?
Wybrałem tę bazę z kilku powodów: po pierwsze, jest to jedna z najpopularniejszych baz wektorowych, która jednocześnie jest darmowa i otwartoźródłowa. Po drugie, sam z niej od dawna korzystam, a po trzecie, używamy jej podczas szkolenia AI_Devs, ponieważ jest łatwa w użyciu, szybka i ma naprawdę niski próg wejścia, aby zacząć z nią pracę (co mam nadzieję, widać też na filmie).
Jak wygląda sprawa bezpieczeństwa tego nowego tworu? Naprawdę zmierzamy do wysyłania wszystko do kogoś obcego by użyć proste AI? Bardzo ułatwia to pracę, ale kurczę, ja jestem starej daty i trochę mnie przeraża dzielenie się tak tyloma rzeczami, bo koszta, bo czas, tak jakby wszystko dążyło do tego by właśnie ludzie skupiali się bardziej na pozornych ułatwieniach niż na bezpieczeństwie. Jak dzieci z telefonami, zamiast rozwijać się, to karmią swoim czasem zabawki.
Jeśli masz potrzebę i możliwości (zasoby GPU), to możesz generować wektory lokalnie z użyciem lokalnie uruchamianych modeli - jest ich sporo. Do profesjonalnego zastosowania nie zawsze da się użyć modelu chmurowego, ale np przy indeksowaniu jawnych danych (np. dokumentacja), nie powinno być problemu.
No ok, ale to przypadek bardzo czysty, wręcz kliniczny i nadaje się do prostych zbiorów danych typu baza linków. Jak w ten sposób zrobić embedding dokumentacji czy regulaminu? Przecież tam jeden "fakt" będzie o wiele dłuższy i wtedy odpowiedzi modelu nie będą już tak ładnie się prezentować.
Sposobów na to jest kilka. Najpopularniejszy polega na rozbiciu np regulaminu na zdania lub akapity. Wyciągasz wtedy pasujące do pytania wyrywki regulaminu i wrzucasz je np do API GPT-4 i prosisz "odpowiedz na pytanie użytkownika korzystając z wklejonej niżej bazy wiedzy". Wklejona baza to znalezione cytaty, a pytanie to... po prostu to, co wpisał użytkownik.
To narzędzie, które bazując na sztucznej inteligencji podpowiada kod, który jego zdaniem powinienem napisać. To takie sprytniejsze autouzupełnianie kodu.