SaraAI

SaraAI

28
49 409

Подписаться

SaraAI - a strong artificial intelligence project
SaraEye - a voice assistant with the sense of sight and intelligence
SaraVision - a new way to recognize an image

RC Car 2 - LEGO Powered by Raspberry Pi CM4 with SaraKIT (Xbox Controll, Python Version)

1:27

RC Car 2 - LEGO Powered by Raspberry Pi CM4 with SaraKIT (Xbox Controll, Python Version)

5 месяцев назад

Xbox Pad Control for Raspberry Pi Projects

0:53

Xbox Pad Control for Raspberry Pi Projects

5 месяцев назад

Voice ChatGPT on RaspberryPi (SaraKIT)

0:25

Voice ChatGPT on RaspberryPi (SaraKIT)

7 месяцев назад

SaraKIT - Text To Speech with Piper on Raspberry Pi

0:33

SaraKIT - Text To Speech with Piper on Raspberry Pi

7 месяцев назад

SaraKIT - Speech Recognition Vosk on Raspberry Pi

0:21

SaraKIT - Speech Recognition Vosk on Raspberry Pi

7 месяцев назад

SaraKIT Short History

1:46

SaraKIT Short History

11 месяцев назад

Revolutionary Silent Pan-Tilt Tracking: Follow Color, Objects & Faces with SaraKIT and Raspberry Pi

0:22

Revolutionary Silent Pan-Tilt Tracking: Follow Color, Objects & Faces with SaraKIT and Raspberry Pi

Год назад

SaraKIT (for Raspberry Pi CM4) BLDC Gimbal Motors (FOC) vs Servo vs Stepper motor (short version)

0:15

SaraKIT (for Raspberry Pi CM4) BLDC Gimbal Motors (FOC) vs Servo vs Stepper motor (short version)

Год назад

SaraKIT Trailer (Raspberry Pi extension board)

0:46

SaraKIT Trailer (Raspberry Pi extension board)

Год назад

RC Car - LEGO Powered by Raspberry Pi CM4 with SaraKIT

2:00

RC Car - LEGO Powered by Raspberry Pi CM4 with SaraKIT

Год назад

SaraEye - This is the world's first ChatGPT with a sense of sight!

3:29

SaraEye - This is the world's first ChatGPT with a sense of sight!

Год назад

SaraEye - This is the world's first ChatGPT with a sense of sight!

3:29

SaraEye - This is the world's first ChatGPT with a sense of sight!

Год назад

SaraKIT (for Raspberry Pi CM4) Self Balancing Robot

2:42

SaraKIT (for Raspberry Pi CM4) Self Balancing Robot

Год назад

SaraKIT (for Raspberry Pi CM4) BLDC Gimbal Motors (FOC) vs Servo vs Stepper motor

17:17

SaraKIT (for Raspberry Pi CM4) BLDC Gimbal Motors (FOC) vs Servo vs Stepper motor

Год назад

SaraKIT Unboxing (Raspberry Pi CM4 HAT)

3:33

SaraKIT Unboxing (Raspberry Pi CM4 HAT)

Год назад

SaraEye - Alexa Smart Speaker with a Sense of Sight

0:45

SaraEye - Alexa Smart Speaker with a Sense of Sight

3 года назад

Smart Speaker SaraEye

2:02

Smart Speaker SaraEye

3 года назад

SaraVision: Face detection on Raspberry Pi (only CPU 20-30% One Core)

0:22

SaraVision: Face detection on Raspberry Pi (only CPU 20-30% One Core)

3 года назад

Smart Assistant SaraEye

2:02

Smart Assistant SaraEye

3 года назад

About the nonsense of deep learning, neural networks in image recognition (using the MNIST kit)

25:18

About the nonsense of deep learning, neural networks in image recognition (using the MNIST kit)

4 года назад

Voice Assistant & Chatbot vs Sara AI

13:17

Voice Assistant & Chatbot vs Sara AI

5 лет назад

Sara AI (Construction of the 3D world with words)

2:54

Sara AI (Construction of the 3D world with words)

5 лет назад

Sara AI and an ordinary cheap (from 15$) IP camera

1:37

Sara AI and an ordinary cheap (from 15$) IP camera

5 лет назад

Sara AI mini demo cz.4 (Rozpoznawanie obrazu i podstawowa rozmowa)

1:03

Sara AI mini demo cz.4 (Rozpoznawanie obrazu i podstawowa rozmowa)

5 лет назад

Sara AI mini demo cz.3 (Proste uczenie)

1:29

Sara AI mini demo cz.3 (Proste uczenie)

5 лет назад

Sara AI mini demo cz.2 (Zapamiętywanie i kalendarz)

1:45

Sara AI mini demo cz.2 (Zapamiętywanie i kalendarz)

5 лет назад

Sara AI mini demo cz.1 (Automatyczne Odpowiedzi)

1:29

Sara AI mini demo cz.1 (Automatyczne Odpowiedzi)

5 лет назад

Комментарии

@Dr.Roitman Месяц назад

hello i really like this machine. Could we collaborate?

@ArturMajtczak Месяц назад

Please contact me at: sarakit.saraai.com/

@muntus 2 месяца назад

is it possible to use BLDC to power belt drive or lead screw like in CNC systems? instead of stepers

@soumyamaitra5839 3 месяца назад

Can we achieve 45 to 50 Kgcm of torque in a motor of a size of 20mm OD? We are thinking of using them in a robot joints which does not have much space.

@2000ReRyRo 4 месяца назад

Why the weird delays in responding by the human? Why does the machine seem more natural than the human?

@kailongwang 4 месяца назад

cool

@0TheImaginary0 4 месяца назад

Thank you for the explanation and the code, everything is working but without voice! can you help me

@ArturMajtczak 4 месяца назад

I suggest you install a ready disk image first, following our guide: sarakit.saraai.com/getting-started/software in case of problems, please write to sarakit.saraai.com/community/contact

@Tetrax-lt8is 4 месяца назад

Upload their tutorial video

@yogi9704 5 месяцев назад

whats the point of the camera, except asking the questions

@ArturMajtczak 5 месяцев назад

1. You don't need to use a wake word like 'Alexa' or 'OK Google'; just look at SaraEye, it sees you and knows you are speaking to it - it’s more natural, the way people communicate. When we are in a group and speak while looking at someone, that person knows we are speaking to them... 2. By looking at the device, and more importantly, SaraEye looking back at you, a unique bond is formed that is hard to achieve by talking to a 'speaker' like Alexa. :)

@Androiddlaniewidomych 5 месяцев назад

Witam, czy obecnie można już kupić to Cudo? I czy jak się dokupi to czy od razu będzie to mówić i będzie można z nią gadać i za ile to można kupić

@ArturMajtczak 5 месяцев назад

Niestety jesteśmy jeszcze w trakcie szukania inwestorów aby móc zacząć produkcję seryjną... Samo urządzenie po podłączeniu jest gotowe do działania, na początku widząc nową osobę może zapytać o imię i inne dane - potem już można pogadać o wszystkim :)

@Androiddlaniewidomych 5 месяцев назад

@@ArturMajtczak dobrze, bo mi na maila przyszło że już gdzieś można te urządzenia kupić, ale żeby to zaczęło gadać to skomplikowanie coś tam było wytłumaczone, a gdzie trzeba to podłączyć? Bo nie rozumiem, to jest przydatne narzędzie trochę dla osób niewidomych zwłaszcza że ja jestem taką osobą i bardzo mnie to na rzędzie ciekawi i nie mogę się doczekać aż będzie to publicznie dostępny, a będzie jakaś informacja że to będzie wydane? Np. na youtubie czy coś? Bo fajnie by było W ogóle to chciałbym żeby zostało na jutuba wrzuconych więcej filmów z Sarą po polsku

@skullhunter4110 6 месяцев назад

Hello

@robrocco5420 7 месяцев назад

interesting

@skullhunter4110 6 месяцев назад

How can I contact you

@adamjachocki2798 9 месяцев назад

Matko Święta, można się u Was zatrudnić? ;)

@gunnar5886 10 месяцев назад

'Promo sm'

@monsieur3d985 10 месяцев назад

Extremely interesting. What do you transmit to ChatGPT so as it could interact through vision ? I guess you give some indications about what your Sarakit "see", is it ?

@ArturMajtczak 10 месяцев назад

Exactly right. The cameras observe the environment, and in the background, a separate program identifies objects, people, motion, etc. This information is invisibly sent as prompts to ChatGPT, which then responds as you can see in the video.

@monsieur3d985 10 месяцев назад

@@ArturMajtczak This reminds me of the SHRDLU program developed by Terry Winograd at MIT in 1968 (based on around fifty nouns, verbs and adjectives in 3D world of blocks). I guess that it takes a lot of computing power to do this analysis, and that you do it on an external server from the pairs of images sent. I guess that Rasperry and your SaraKit card are used only to position the motors, process the image and sound and communicate with the server, is it ? Your approach is interesting. Do you think the GPT-4 Vision update uses a similar principle and communicates through prompts with the conversational system? (this system quickly has its limits it seems to me).

@ArturMajtczak 10 месяцев назад

@@monsieur3d985 Sending images to a server and waiting for a response is indeed too slow and costly, so the image analysis is actually done on the Raspberry Pi itself, using a simple trained model. While this model might not recognize everything, it certainly has broad and sufficient capabilities. Image recognition isn't performed in real-time at 25 frames per second - that's not necessary at this stage. We just analyze changes in the background image, which takes about 100 to 600 ms. As I mentioned, this process runs in a separate thread and is efficient enough for our purposes. In terms of the GPT-4 Vision update, while it might use a similar principle of communicating with the conversational system through prompts, our approach focuses on local processing to avoid the delays and costs associated with server-based processing. This method, although it has its limitations, is quite effective for our current needs.

@AvivMakesRobots 10 месяцев назад

Hey, can I pay you - you just ship me one so I don't have to wait until February to get it?

@ArturMajtczak 10 месяцев назад

At the moment, we don't have ready units for sale just yet, but the good news is that we've made our first trial series. We've received it and are currently in the testing phase. The first approximately 150 people who order through CrowdSupply should receive their SaraKIT significantly earlier.

@AvivMakesRobots 10 месяцев назад

@@ArturMajtczak Sorry to be so demanding, but what would the ETA be for ordering from CrowdSupply?

@ArturMajtczak 10 месяцев назад

I apologize, but at this moment, I can't specify an exact ETA for orders from CrowdSupply. It largely depends on the campaign we're running there. I should be able to give you a more precise estimate right after the campaign concludes.

@Androiddlaniewidomych Год назад

Ale to fajnie Ja chcę to mieć

@immune_eyes Год назад

Nie patrzy ale słyszy haha. 4 rewolucja. Rozwijasz tylko system pol i c yjny aby później oni mogli zni e w oli ć ludzi .. Uczysz rozpoznawać nowych rzeczy z pomocą innych użytkowników odpowiadających na pytania Przykre

@ArturMajtczak Год назад

hmm... to chyba po prostu postęp, nie unikniemy go, zrobimy coś my lub inni, my możemy tylko dbać, aby technologia była wykorzystywana jak najlepiej, starać się ją zabezpieczać na ile się da, a da się - wiemy jak to robić...

@immune_eyes Год назад

@@ArturMajtczak Dla Pana postęp dla innych udoskonalanie nie wolni cz e g o sy s t, em u . Wiem taka Pana praca. Ok. Ale jak zaproponują grube miliony to dobrze by było aby Pan tego nie sprzedawał, bo tak jak wszystko obrucą przeciwko nam. Czas Panu sprzyja. Za 2 mc zaostrzenie ko n fl ik tu , później nowa za r a, z a . . z ch, i n, .. przywracanie ob os,t rz,e ń ń także taka technologia będzie bardzo potrzebna do kon, .t roli, , weryf i kacji, , raportu. ,. aby zarobić musi szybko wyjść wersja dla firm

@strongme80 Год назад

That's pretty cool!

@Androiddlaniewidomych Год назад

Gdzie to można kupić jak idzie projekt.

@ArturMajtczak Год назад

Rozwijamy projekt, ale jeszcze nie jest dostępny w sprzedaży

@Androiddlaniewidomych Год назад

@@ArturMajtczak dobrze co wam się ostatnio udało osiągnąć chcę jeszcze zobaczyć co ona potrafi jeśli chodzi o takie filmiki na YouTubie

@Androiddlaniewidomych Год назад

Ja chcę to kupić Już się nie mogę doczekać

@immune_eyes Год назад

To tylko bajke potrafi opowiedzieć i liczy

@Androiddlaniewidomych Год назад

@@immune_eyes tylko tyle? No to słabe to jest ale na filmiku było pokazane jeszcze innych parę rzeczy

@stanisawstulej3092 Год назад

Trochę tutaj zaszalałeś ;) W prawdziwym świecie musisz umieć rozpoznać kontekst. Dwie pionowe kreski to może być "1 1", "i i", "I I" (duże i), albo zwyczajne dwójka rzymska. Twoja metoda przypomina klasyczny OCR z lat 90 gdzie odczytany tekst ma mnóstwo głupich literówek. No i spróbuj przełożyć swoją metodę na coś, czego pewnie nie znasz i jest trudne do nauczenia np. alfabet chiński ;)

@ArturMajtczak Год назад

klasyczne dawne OCRy były oparte na algorytmach rozpoznawania praktycznie każdego znaku inaczej. 100 znaków, 100 algorytmów. Tu jest jeden. i tak II (duże i) i ll (małe el) i rzymska cyfra nie będą rozpoznane bez kontekstu - człowiek też tego nie potrafi. Jeżeli zbiór jest ograniczony do cyfr lub tylko znaków jest łatwiej. Jeżeli mamy i z kropką i I (i duże) też są to już inne znaki tzn. jeżeli będzie kropki nad linią to będzie to i (małe i) z większym prawdopodobieństwem niż I.

@JanBoromeusz Год назад

robi wrażenie :-) mam kilka urządzeń z Asystentem Google ale ten projekt pod względem komunikacji bije je na głowę (i nie chodzi tylko o język polski) Chętnie bym zakupił przy najbliższej okazji :)

@ArturMajtczak Год назад

używaliśmy SaraEye z Google i Alexą i szczerze mówię że rozmowa z tymi asystentami była nudna, po kilku zdaniach nie było sensu więcej gadać, sterowanie urządzeniami, proste pytania to jakoś działało, ale rozmowa nie była możliwa. Dlatego dodaliśmy własną AI SaraAI i nabrało to sensu, ale nie będę ukrywał że SaraAI nie jest gotowa i na tą chwilę połączenie SaraEye z widzeniem i z ChatGPT śmiga niesamowicie, wiele takich rozmów naprawdę zaskakuje. Mam nadzieję że jeszcze niedługo dodamy SaraAI, która będzie mocna w czymś zupełnie innym niż ChatGPT, uzupełni go tam gdzie on wogóle nie sięga.

@JanBoromeusz Год назад

@@ArturMajtczak Czy SaraEye też będzie potrafiła sterować urządzeniami smart home?

@ArturMajtczak Год назад

oczywiście

@mirus922 Год назад

Witam. Jest już dostępne do kupienia?

@redtruetv3664 Год назад

Cześć mam fajny pomysł do tego ale stworzyłem kod jak narazie w Pythonie do pisania dla chatgpt i odpowiada mi w formie mowy

@redtruetv3664 Год назад

I czy możesz mi pomóc z ty proponuję współpracę

@ArturMajtczak Год назад

proszę o więcej info na info@saraai.com

@kam7847 Год назад

Cool, where can I buy it?

@ArturMajtczak Год назад

We are developing the project, but it is not available for sale yet

@2000ReRyRo 11 месяцев назад

Kind of ironic that you call this a "natural" conversation. It is so UNnatural that I'm not sure which is the robot -- the little black thing sitting on the desk or the bigger white thing sitting on the chair.

@ArturMajtczak 10 месяцев назад

@@2000ReRyRo heh heh

@dawidfurmaniewicz5550 Год назад

Wspaniałe!

@himenatika Год назад

Wiem, że to gotowy kit, ale czy planuje Pan także dystrybucję oprogramowania, które mogłabym przystosować do własnej konfiguracji? Jeśli takowe istnieją, to chętnie się zapoznam. Pozdrawiam

@ArturMajtczak Год назад

całe oprogramowanie jakie tworzymy w tym rozwiązaniu będzie publikowane na stronie i github.

@hades5444 Год назад

ciekawe!

@roncerbo7238 2 года назад

I love this and how to buy to order this gadget

@MrBombastyczny 3 года назад

Oczywiście życzę sukcesu temu projektowi, lecz mam kilka ale Jeżeli to będzie jako dodatek do Alexy i będzie współpracował z każdą Alexą to + Jeżeli natomiast trzeba będzie kupować nową Alexę z ta kamerką, to obawiam się że sprzedaż będzie mała, więcej osób wypróbuje ten gadżet dokupując go do swojej Alexy niż będzie kupować zupełnie nowe urządzenie, które defacto będzie jedynie lekkim ulepszeniem (za małym żeby wydawać tyle kasy na nowe urządzenie) No i to nazewnictwo Skoro bazuje to na aleksie to nie lepiej pozostać przy AlexaEye Nawet głos mamy tu Alexy i co nagle kobitka zmieniła imię ;)

@ArturMajtczak Год назад

Alexa to głośnik :), nie można dokupić czy dokręcić do głośnika opcji dwóch gimbalowych kamer :) Sama Alexa nie widzi, nie ma żadnej obsługi widzenia - co najwyżej można ją poprosić, aby pokazała obraz z kamery w garażu na laptopie. SaraEye to coś więcej niż dodatek, to upgrade do wersji 2.0 całego urządzenia :)

@KlauduniaL07 3 года назад

Projekt wydaje się być ciekawy, ale skoro to polski produkt, to dobrze, gdyby rozumiał polski i mówił po polsku, takich asystentów obecnie brakuje. Gdyby tak było i to w przystępnej cenie (powiedzmy do 600 zł) to SaraAI mogłaby zwojować polski rynek. Kolejna, w sumie najważniejsza kwestia to bezpieczeństwo. Nikt by nie chciał, żeby złodziej podłączył się do kamerki i obserwował domowników. Tu by trzeba opracować taki system, aby to było niemożliwe lub bardzo trudne.

@ArturMajtczak 3 года назад

Prywatność i bezpieczeństwo jest dla nas bardzo ważne - dlatego na komendę "nie patrz" kamera nie tylko się wyłącza ale całkowicie odwraca od rozmówcy co widać na tym filmie: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-Vdm8goOZrB4.html

@mirus922 3 года назад

Bardzo ciekawy projekt. Z mila chcecia juz bym ja przetestowal. Zycze powodzenia 😀

@staszekpodroznik9690 3 года назад

Ja bardzo chętnie obejrzałbym dodatkowe filmy. :) Bardzo dobry pomysł. :)

@piotrkalinowski3970 3 года назад

Czekam z niecierpliwością na Sarę. Pozdrawiam.

@JakubKralka 3 года назад

Adam ostatecznie nie wziął leków, a Sara komfortowo podziwia jak obściskuje się z żoną na kanapie

@ArturMajtczak 3 года назад

Spokojnie Sara mu znowu przypomni, ale faktycznie powinien powiedzieć "nie patrz" jak tu: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-Vdm8goOZrB4.html :-)

@stanisawstulej3092 Год назад

@@ArturMajtczak Raczej Sara sama powinna wykrywać intymną sytuację. W dodatku nadal jest obawa o prywatność, bo mikrofon jest aktywny.

@himenatika 3 года назад

Z wielkim podziwem obserwuję postepy nad projektem :)

@koszal_ 3 года назад

Dlaczego na kanale nie pojawiają się nowe filmy?

@ArturMajtczak 3 года назад

pracujemy nad czymś dużym, za kilka miesięcy na pewno sie pochwalimy...

@koszal_ 3 года назад

@@ArturMajtczak W takim razie czekam z niecierpliwością

@janjaszczak3059 4 года назад

Wygląda na to że się trochę mineliśmy. Jestem w drugiej rundzie inkubacji. Ciekawi minie czy Sara je dzieci? :)

@ArturMajtczak 4 года назад

w jakim sensie się minęliśmy zapytam z ciekawości? podobny projekt? można coś gdzieś zobaczyć?

@adirherr9279 4 года назад

"Potraktujcie tę metodę jako podstawowe ABC, które rozwijając można bez problemu używać do [...] ImageNet" Chciałbym to zobaczyć ( ͡º ͜ʖ͡º).

@restorato 5 лет назад

Jak dużo próbek głosu potrzebnych było do utworzenia bazy danych wymaganej dla algorytmu rozpoznawania mowy? Ile słów liczy baza(orientacyjnie)? Pozdrawiam, Jędrzej Małkowski

@ArturMajtczak 5 лет назад

Do rozpoznawania mowy wykorzystujemy gotowe API Google, jedynie w przypadku gdy Sara nie ma kamery i nie widzi rozmówcy aby wiedziała że mowa skierowana jest do niej należy ja wywołać imieniem i w tym wypadku imię jest rozpoznawane przez program.

@morgrabia 5 лет назад

Wygląda coraz lepiej faktycznie. Powodzenia

@waleorki2016 5 лет назад

2/10

@ArturMajtczak 5 лет назад

Czemu 2 na 10 i za co? :)

@waleorki2016 5 лет назад

@@ArturMajtczak za całokształt. Przecież to wszystko farsa. Nie wspominasz w ogóle o jakichkolwiek rzeczach związanych z używaną technologią. Powodzenia w szukaniu inwestorów.

@ArturMajtczak 5 лет назад

hehe, szybka ocena jak piszesz bez znajomości tematu, bez zapytania o to co cię interesuje - trochę optymizmu :-)

@Desseres 5 лет назад

audi z 2013, zapisała że 2003 i odpowiedź że 2013? Coś tu się nie zgadza ...

@ArturMajtczak 5 лет назад

faktycznie nie zauważyłem - wypowiedziane zdanie zostało źle rozpoznane - nie miało sensu i nie zostało zapamiętane, ale ponieważ Audi faktycznie kupiłem w 2013 roku i pewnie już kilka razy to mówiłem i Sara odpowiedziała poprawnie to po prostu nie zauważyłem tego problemu. Program nie jest jeszcze doskonały, ma wiele błędów, ale robimy wszystko aby przyspieszyć pracę i udostępnić pierwszą wersję do testów dla wszystkich co nie tylko nam mocno pomoże w dalszych pracach, ale też pomoże Sarze szybciej się uczyć.

@himenatika 5 лет назад

chciałabym użyczyć jej głosu :)

@Xsanty666 5 лет назад

To wygląda coraz lepiej.

@morgrabia 5 лет назад

fajne,czekam z niecierpliwością jak to się rozwinie dalej.Powodzenia.

@Xsanty666 5 лет назад

W cale nie creepy, podoba mi się xD

@kertoipcrass 5 лет назад

Kto nauczył nie lubić piwa !?

@ArturMajtczak 5 лет назад

myślę że jak ktoś dłużej z nią ładnie pogada to może ją namówić na łyk...

@Tee2000DE 4 месяца назад

@@ArturMajtczak AI powinna sama dojść do tego, czy lubi piwo, czynie.