Тёмный

Готовая умная колонка для Home Assistant через ESP32 и ESPHome на примере M5Stack ATOM Echo 

У Павла!
Подписаться 37 тыс.
Просмотров 16 тыс.
50% 1

M5Stack ATOM Echo: alii.pub/6wkm66?erid=2SDnjd3yeic
Покупал в официальном магазине тут, но там разобрали, оставлю ссылку на будущее может появится: alii.pub/6wkm7j?erid=2SDnjdPFVP6
В этом видео показал как сделать умную колонку для Home Assistant из микрофона, динамика, esp32 в ESPHome.
В качестве примера взял готовое решение от компании M5Stack - ATOM Echo. В нем уже есть динамик и микрофон и rgb светодиод. Даже ESPHome у меня был предустановлен.
По итогу тестов, эта миниатюрная колонка пробуждается по кодовому слову, распознает команды, но задержка между отправкой команды и выполнением 5-6 секунд. И в ходе испытаний выяснилось, что это ограничения моего процессора Intel N5105, он во время распознавания голоса грузится на 100%. Для более лучшей работы колонки надо использовать мощный сервер с Home Assistant.
Так-же для управления голосом нужны предварительные настройки в Home Assistant. Которые я показывал в этом видео: • Управление голосом сер...
И которые описаны тут: psenyukov.ru/%d1%83%d0%bf%d1%8...
Меня можно поддержать на Boosty: boosty.to/upavla
Подписаться на телеграмм канал можно по ссылке: t.me/+K05yDjyd4tJmYjky
или
t.me/ypavla
Мой 3d принтер: alii.pub/6w49s6?erid=2SDnjcQ2tFr
Крутой тепловизор Infiray p2 pro: alii.pub/6w49u4?erid=2SDnjctCecQ
Теги: #Упавла! #homeassistant #умныйдом #voiceassistant #m5stack #esphome
================================================
Помощь каналу: www.donationalerts.ru/r/ypavla
Реклама: ООО "АЛИБАБА.КОМ (РУ)" ИНН: 7703380158

Наука

Опубликовано:

 

28 фев 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 52   
@upavla
@upavla 3 месяца назад
Подписывайтесь на телеграмм канал: t.me/ypavla
@Vilz19
@Vilz19 3 месяца назад
Виспер же! Ш - это «sh». Wh - это мягкая «в»
@Bad_idea965
@Bad_idea965 3 месяца назад
Бесит, правда, вроде грамотный человек, а произношения вообще нет, наверное немецкий в школе изучал ...
@MrDronix27
@MrDronix27 3 месяца назад
Шиндоус 😊
@MrBarannikGeorge
@MrBarannikGeorge 3 месяца назад
What - вшат?
@user-dc5li7ey5s
@user-dc5li7ey5s 3 месяца назад
Доброго дня! А колонку sberboom нельзя использовать в Home Assistant для управления?
@Dzen_Dzenovich
@Dzen_Dzenovich 3 месяца назад
Затестил сервер стоит на 2680v4 задержка в пол секунды но это через микрофон к асистанту как с m5stack я не знаю
@user-rm3jh5im1u
@user-rm3jh5im1u 3 месяца назад
Купил недавно этот M5 atom, хрень полная в сравнении с яндекс колонкой, atom слышит не дальше одного метра
@flibustieros
@flibustieros 3 месяца назад
Хорошее начало команды: "неипу..."
@user-jp7uw5qw8f
@user-jp7uw5qw8f 3 месяца назад
Виспер у меня вообще не заводится. Пользуюсь vosk от rhasspy, задержка минимальная, распознавания не плохое.
@rykov_dc
@rykov_dc 3 месяца назад
Павел, не Вшиспер, а Виспер)
@MrDFR-qr7ib
@MrDFR-qr7ib 3 месяца назад
Спасибо за инфу !
@u17l305194817
@u17l305194817 3 месяца назад
Спасибо Павел, очень полезная инфа. А кто в итоге переводит команду в текст - M5Stack или сервер с хомеасистом?
@silentage6310
@silentage6310 3 месяца назад
сервер. whisper - voice to text piper - text to voice openwakeword - слушает весь звуковой поток постоянно и ждет активационного слова
@u17l305194817
@u17l305194817 3 месяца назад
@@silentage6310 т.е. M5Stack выступает в качестве микрофона с динамиком получается?
@upavla
@upavla 3 месяца назад
@u17l305194817 ну да
@vadimchernov2509
@vadimchernov2509 3 месяца назад
как вариант повозится штука интересная но полноценную колонку сделать всеж сложновато будет)
@user-ux8gq7zx8v
@user-ux8gq7zx8v 3 месяца назад
Спасибо за интересное освещение прогресса! Подскажите, Вы пробовали в настройках "распознавание речи" выбирать не whisper, а home assistant cloud? Судя по ролику ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-PJD1BbPwOLM.htmlsi=23HO7ksB89J2AA1P там скорость распознавания должна быть намного выше. Да, данные передаются в облако, но как этап развития, почему бы и нет. Буду рад увидеть этот эксперимент на Вашем канале.
@upavla
@upavla 3 месяца назад
Эта функция вроде платная
@morphiai
@morphiai 3 месяца назад
Месяц бесплатно, работает так же плохо на русском
@user-rw6qd7fz4m
@user-rw6qd7fz4m 3 месяца назад
Кстати wakeword можно свой сделать, чтоб набу не звать. Избушка избушка было бы прикольно
@serg3659
@serg3659 3 месяца назад
Назвать ее Галей, чтобы по команде "Галя, отмена!" выключать будильник.
@vasyafortochkin3114
@vasyafortochkin3114 3 месяца назад
А есть возможность подключить esp32 к home assistant не по wi-fi, а по кабелю? С той задумкой, чтобы иметь один сервер HA, а ESP32 с датчиками далеко от него и связь была бы по кабелю?
@silentage6310
@silentage6310 3 месяца назад
у есп32 (основная, не C/S серий) есть подержка ethernet так что в теории можно
@user-em7tl8mg3c
@user-em7tl8mg3c 3 месяца назад
Так Алиса же вырубится при отвале интернета, а свой север будет работать. Так?
@Tvsafari2
@Tvsafari2 3 месяца назад
Я использовал войс модуль с распознаванием голосовых меток. Работает, как часы, мгновенно. Но голосовые метки - это куча ограничений. В итоге, перешел а Алису.
@pa3gonShaboLdov
@pa3gonShaboLdov Месяц назад
Что за модуль?
@bender_ostap1897
@bender_ostap1897 3 месяца назад
Полезно , пока Алиса лучше.
@dartwejders
@dartwejders 3 месяца назад
Вот скажите, кто в курсе. Как же тогда колонки яндекс и гугл умудряются распознавать голос без интернета? Да, они не выполнят все команды, но распознать могут. Та же миди позволяет управлять зигби устройствами офлайн. Там ведь нет мощного процессора, но распознает она сразу.
@romanenot
@romanenot 3 месяца назад
А что такое миди?
@TRUMPRUM
@TRUMPRUM 3 месяца назад
Так есть же видос про разработку миди, посмотри, там как раз это объясняется.
@user-ec2vy5uc4n
@user-ec2vy5uc4n 3 месяца назад
Потому что все решает софт,на железе далеко не уедешь
@dartwejders
@dartwejders 3 месяца назад
станция яндекс миди@@romanenot
@dartwejders
@dartwejders 3 месяца назад
не видел, посмотрю. спасиб@@TRUMPRUM
@user-rw6qd7fz4m
@user-rw6qd7fz4m 3 месяца назад
Тест , реп, пепси
@morphiai
@morphiai 3 месяца назад
Пробовал на Echo прошивку assist мой голос не распознает из 10 один раз хоть nabu alexa custom, на прошивке медиаплеера не работают play pause stop если нажать зависает и дергаешь питание, сейчас прошил их под шлюз BT для чайника redmond хоть что то полезное делают, под медиаплееры взял платы Esp32-Audio-Kit прошивка Squeezebox. Дичь полная эти echo или хозяин попугай по десять раз повторять.
@Ipeacocks
@Ipeacocks 3 месяца назад
4 ядерного процессора не достаточно? ух!
@silentage6310
@silentage6310 3 месяца назад
там дело даже не в ядрах. для нейросетей важно чтобы были AVX и FMA инструкции в процессоре. на N5095/5105 их нет. надо хотя бы N95/N100... а лучше бы чтото с видеокартой.
@DmitryKey
@DmitryKey 3 месяца назад
Голос на ЦПУ обрабатывать - такая себе идея. На nvidia будут летать любые модели. Но из-за энергопотребления это так себе вариант. Надежда на новые apu от интел и поддержку их графики виспером, какие-то поползновения уже есть на гите. А может блоки npu выстрелят и на них можно будет задачу отдать, увидим. Атом для голоса - бесполезная штука, постоянный спам сервера аудиоданными, лучше б собирал на оранже.
@qMILSTORM
@qMILSTORM 3 месяца назад
Яндекс колонка прекрасно с этим справляется на древних Amlogic.. Надежда на интел уже как года 3-4 нет ни каких , а вот АМД другое дело.
@silentage6310
@silentage6310 3 месяца назад
в идеале бы на esp выделять моменты когда есть голос и только в эти моменты отправлять его. а совсем в идеале чтобы wakeword обрабатывался на esp, как в алисе. я думаю это вполне реально, но надо делать...
@DmitryKey
@DmitryKey 3 месяца назад
@@silentage6310 Так парни из набукасы уже сделали, на ESP32-S3 с psarm запускается. Проект называется microwakeword. А за месяц до этого Wyoming satellite для малин выкатили. ww - не основная проблема. Необходимо энергоэффективная аппаратная часть для работы whisper (или что нас там ждет впереди). По хорошему ещё и обработчик на основе llm надо интегрировать, чтоб была свободна формулировки команд, а не по одной согласно шаблона озвучивать. Сейчас народ с помощью chatgpt подобное делает, но это облачно и за прайс. Задел большой
@dNix
@dNix 3 месяца назад
@@qMILSTORM эти "древние" amlogic как раз имеют NPU.
@user-lw8fu5rg6w
@user-lw8fu5rg6w 3 месяца назад
А я в каждый угол Алис набросал) они очень качественно отрабатывают)
@silentage6310
@silentage6310 3 месяца назад
главное важного ничего не говорить. а то надо понимать что алиса это товарищ майонр в каждом доме
@MARK2580
@MARK2580 3 месяца назад
научись использовать закладки в браузере
@user-cd5lw9yk2u
@user-cd5lw9yk2u 3 месяца назад
Научись не душнить
@-Darkweider
@-Darkweider 3 месяца назад
Мертворожденная хрень за цену простой станции с барахолки.
Далее
СКАЧАЛ РОДИТЕЛЯМ МУЗЫКУ 8
00:47
Просмотров 194 тыс.
Homemade Professional Spy Trick To Unlock A Phone 🔍
00:55
Доработка ESP32 ВАЖНО!
3:30
Просмотров 50 тыс.
Bardak ile Projektör Nasıl Yapılır?
0:19
Просмотров 5 млн