Speech recognition / Python Lessons

Exploring the IT World / Oleg Shpagin / WISEPLAT

Подписаться 148 тыс.

Просмотров 28 тыс.

50% 1

Видео Поделиться Скачать Добавить в

Опубликовано:

20 окт 2024

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист

Посмотреть позже

Комментарии : 69

@wiseplat 4 года назад

►► Смотри все уроки по Python: ru-vid.com/group/PLxiU3nwEQ4PHtLT8LzGAdcuzE-laotXps Пишите в каких проектах вы планируете это использовать или уже используете!

@АндрейП-ц5ы 2 года назад

Здравствуйте! Спасибо за детальное объяснение. Применение помочь другу слепому написать голосового помощника.

@Руссофобзатевающийрусофобию 2 года назад

Скажите пожалуйста почему во всплывающем меню для автозаполнения не всплывает Microphone ? Почему всплывают не все подсказки? Или может вы знаете нормальный плагин для VS Code с нормальными подсказками. Был бы благодарен. А то я понаустанавливал а толку не вижу.

@Руссофобзатевающийрусофобию 2 года назад

Длинное видео. Мелкий текст на белом фоне. Было бы идеально сократить все до 5 минут.

@MrKim-pt2vm Год назад

а как аудиофайл распознать-то?

@MrKim-pt2vm Год назад

а где видео про использование готового аудио файла, без подключения к микрофону, просто mp3 файл в текстовый

@holodnieryki9882 4 года назад

Веду разработку диплома по похожему принципу(использую ту же библиотеку). Дипломный проект рассчитан на людей (с особым уклоном на программистов) с ограниченными возможностями, а точнее тех у кого проблемы с руками. Разрабатываемая программа позволяет писать программный код голосом (упрощенно, т.е. в неё уже занесены определенные фразы которые заменяются на программный код.(например: "если" - if( ){ } или же "переменная целого типа" - int ). Есть возможность запуска различных внутренних программ системы, поиск в интернете по запросу, управление различными окнами программ (перемещение, копировать/вставить, выделить и тд), запись программного текста и обычного и тд. Желаю удачи с каналом!

@wiseplat 4 года назад

Привет! Крутой проект создаете! Удачи в проекте!!!

@ernesttrachuk6931 4 года назад

привет , ты используешь recognize_google ? как платную версию ? я так же пишу диплом + практика с такой темой и мне надо Open Sourse API который будет хорошо понимать речь у гугла есть ограничения , а всё хорошее платно как вы решили этот вопрос ?

@holodnieryki9882 4 года назад

@@ernesttrachuk6931 а если хотите практически без лимита то покопайтесь в сторону "Kaldi"(это инструменты для распознавания речи) Если уж хотите прям прям заморочиться то CMUSphinx в помощь, он и оффлайн и гибок, нооо чутка топорный в плане распознавания)

@ernesttrachuk6931 4 года назад

@@holodnieryki9882 Sphinx не чутка топорной , а конкретно такой топорный , да он конечно работает офлайн , но он даже с английским не справляется я сейчас рассматриваю kaldi , vosk и wav2latter но всё же лучше спросить у того кто уже с этим хорошо знаком , чтобы не делать лишней работы

@holodnieryki9882 4 года назад

@@ernesttrachuk6931 Ещё есть что-то такое snowboy.kitt.ai/ с ним не работал но всё же

@sokolov1976 4 года назад

Спасибо всё заработало до этого пробовал не получалось у вас поглядел и сделал

@sereja732 4 месяца назад

У меня при запуске программы микрофон работает только 1 секунду и выключается 😢

@ЛаураШегирова 3 года назад

Супер! Все получилось! Огромное спасибо!!!

@mrmaksimal04ka Год назад

Добрый день, возник вопрос. Когда я выводил какие у меня есть микрофоны у меня вместо русский букв высвечиваеться это:Р”РёРЅР°РјРёРєРё (High Definition Audio 6 Р”РёРЅР°РјРёРєРё (Razer Seiren X). Помогите пожалуйста. Что делать?

@gurin.shorts 2 года назад

Олег, привет! У меня не получается пишет какую-то ошибку связанной с PyAudio хоть я его не импортировал. Какой-то бред, но мне обидно(

@14768351 4 года назад

Спасибо большое, помогло разобраться

@benandrew7390 3 года назад

Спасибо, очень интересно!

@westour4183 4 года назад

Очень хороший урок, жаль что мало лайков(

@__Voidman__ 3 года назад

согласен

@voronow3 2 года назад

@@__Voidman__ а я - не согласен: автор предлагает пользоваться проприетарными сервисами коммерческих корпораций, в то время, как есть бесплатные и открытые проекты по распознаванию речи, вроде того же VOSK или CMU Sphinx.

@__Voidman__ 2 года назад

@@voronow3 я и не знал, спасибо большое

@римурутемпест-ь8с 8 месяцев назад

У меня проблема cmd говорит что pip не является внутренней или внешней программой

@Mentalist_1337 2 года назад

Хочу задать вопрос... имеется такая библиотека в питоне "speech_recognition as sr" и функция собственно скажем r=sr.Recognizer(). Так вот какую нейросеть использует Google в функции r.recognize_google? Если возможно ссылку про нейросеть гугла для распознавания речи)

@runpythonru 2 года назад

У Олега все уроки хорошие

@НадеждаГорбач-ю2ш 2 года назад

Как можно сделать, чтобы оно разпозновало моментально?

@hat4et 3 года назад

интересует именно оффлайновое распознавание...без всяких там сервисов от гугла и яндекса

@vitalimanjur8563 3 года назад

хороший вопрос: удивительно все используют сервисов от гугла и яндекса а резервный все молчат как рыбы 🤣🤣🤣🤣🤣🤣🤣🤣🤣🤣

@33Aleksey33 3 года назад

Второй урок есть? Из файла аудио.

@смешныемемы-г1ж 3 года назад

Здравствуйте! Скачиваю библиотеку, но она не скачивается(у меня пайтон 3.9), как я понимаю нужна версия 3.8?

@Misha-g4k 2 года назад

в меня ошыбка при вводе команды pip install SpeachRecongnition

@kamikazekot Год назад

Какая именно?

@НикитаПайков-я7в 2 года назад

возникла проблема. Все идет хорошо, но когда я что-то говорю выскакивают ошибки. Помогите

@aserr3149 2 года назад

А что же могло пойти не так?... (Сарказм)

@ernesttrachuk6931 4 года назад

Добрый день, тут вы используете тестовую версию recognize_google я пишу диплом + практика и для всего нужно распознавание речи мне надо Open Sourse API который будет хорошо понимать речь у гугла есть ограничения не могли бы вы посоветовать хороший API для моих задач в приоритете английский , польский и русский языки , но хотя бы английский на хорошем уровне распознания чтобы был но самое главное это чтобы не было ограничений по количеству запросов

@Venux777 3 года назад

Вопрос к автору. На вас последняя надежда. Пишу курсовую работу на эту тему. Работаю с ПайЧарм Инсталирую библиотеку через смd Но с импортированием ее же в ПайЧарм идет проблема: "import speech_recognition as sp ModuleNotFoundError: No module named 'speech_recognition'" Подскажите в чемм может быть проблема. уже все сносил и ставил заново самая новая весрия ПайЧарм стоит Пайтон 3.9.4 пробовал кучу методов, но ничего не работает. ПОМОГИТЕ!!!!!!

@iisuspomozhet 3 года назад

максимум питон 3.7.х (у меня установлен 3.6), также нужно установить pyaudio (c которой тоже могут быть проблемы),плюс нужно удалить параметры среды, касательно Python (PyCharm не трогай) и создать их заново (1 - путь расположения Python, 2 - путь расположения Scripts. Имена path). Если не разобрался еще, пиши, отвечу

@iisuspomozhet 3 года назад

r.recognize_google(audio, language='en-US').lower() - эта строка должна запустить скрипт. Проверь со строкой в твоем коде.

@pythontop2158 2 года назад

@@iisuspomozhet здраствуйте у меня появилась проблема с pyAudio можете подсказать как её решить

@disabrii Год назад

привет, а у тебя получилось решить проблему? Столкнулась с такой же(

@Venux777 Год назад

@@disabrii так Якщо ти користуєшся саме ПайЧармом, спробуй через F12 (Fn+F12) відкрити консоль, і імпортувати саме в ПайЧарм. Також на Віжуал можна зробити аналогічно. Це лише один із варіантів вирішення, якщо не вийде, напишіть мені знову, я допоможу!

@Dangerous_ACCIDENT786 3 года назад

А вы сможете мне сделать такую программу или сайт

@aleksandriakovlev8243 3 года назад

Я стопорнулся на выводе списка микрофонов print(sp.Microphone.list_microphone_names()) ошибка Traceback (most recent call last): File "C:\Users\aluruguay\AppData\Local\Programs\Python\Python39\lib\site-packages\speech_recognition\__init__.py", line 108, in get_pyaudio import pyaudio ModuleNotFoundError: No module named 'pyaudio'

@АндрейКутузов-ф4п 3 года назад

Такая же фигня

@Eonflaks1 3 года назад

pip install pipwin pipwin install pyaudio это выполните и заработает

@pythontop2158 2 года назад

@@Eonflaks1 спасибо огромное !!!!помогло!!!!!!

@MrOMEGARUS 2 года назад

@@Eonflaks1 Огромное спасибо!!! Сегодня весь день всякой хренью занимался - и пип обновил и по отдельности вручную разные модули и визуал си++ до 14.0 поправил... Но помог только Ваш совет...

@tincersgmd701 3 года назад

подскажите как исправить эту ошибку C:\Users\User>pip install SpeechRecognition Collecting SpeechRecognition Downloading SpeechRecognition-3.8.1-py2.py3-none-any.whl (32.8 MB) |████████████████████████████████| 32.8 MB 43 kB/s Installing collected packages: SpeechRecognition Successfully installed SpeechRecognition-3.8.1 WARNING: You are using pip version 20.2.3; however, version 21.0.1 is available. You should consider upgrading via the 'c:\users\user\appdata\local\programs\python\python39\python.exe -m pip install --upgrade pip' command.

@pythontop2158 2 года назад

Это всего-лишь предупреждение на это можно не обращать внимания

@jandosabdiraiym5623 3 года назад

super

@ОлегЖ-н6й 3 года назад

Здравствуйте, Олег. А на W-7 будет работать?

@alexanderpadalka5708 3 года назад

✔

@tiollife2866 Год назад

У меня вообще не работает

@ВсеиСразу-о5ю 4 года назад

у меня ошибка в начале там пишет не найдено pip

@wiseplat 4 года назад

Привет! Скорее всего при инсталляции Python вы не установили галочку Add Python 3.8 to PATH. Можно повторно запустить установку Пайтон и выбрать вариант Modify (Модифицировать) - и поставить эту галочку. Попробуйте, если что, напишите. Есть еще пару подходов )))) Windows: Скачайте файл get-pip.py и сохраните у себя на компьютере. Откройте командную строку и перейдите в папку, в которой сохранен get-pip.py В командной строке выполните команду: python get-pip.py или python3 get-pip.py PIP установлен!

@wiseplat 3 года назад

Привет! ))) Вот смотри как установить pip: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-hqLN2vKpq7Q.html

@0d1ssey 2 года назад

Что делать если код запускается, а речь не записывается и ошибок не выдаёт? pyaudio и portaudio успешно установлены. Mac OS big sir

@Какработает-д7ж 3 года назад

Почему он во всех своих уроках не моргает?

@proton5897 3 года назад

смотрит тебе в душу

@первый-я4ю 4 года назад

как распознавать речь ни слова а вот куда обращаться да ---- я разочарован(

@wiseplat 4 года назад

Привет! Это урок про быстрый способ распознавания речи и создание интерактивных приложений, который может покрывать 90% потребностей. Если хочешь узнать более глубоко про нейросети для распознавания аудио/видео, как их строить (сколько уровней и сколько нейронов на каждом уровне), как их обучать (например методом обратного распространения), как их оптимизировать (например генетическими алгоритмами), выявлять образы и т.д., то записывайся к нам на курсы - мы там тоже такое рассматриваем! wiseplat.org/course-python

@первый-я4ю 4 года назад

@@wiseplat спасибо!

@КАССХИ 2 года назад

Скучное видео

@ЮрійСкоб Месяц назад

Здравствуйте, хотел вывести список микрофонов, но вывод кириллицы получился не совсем: моя строка - нормально, а описание микрофонов - псевдо. ---- код --------------- import speech_recognition as sp import pyaudio list_mic = sp.Microphone.list_microphone_names() print("список доступных микрофонов: ") for i in range(0, len(list_mic)): print(i, list_mic[i]) ----- вывод ------------------------ список доступных микрофонов: 0 РџРµСЂРµРЅР°Р·РЅР°С‡РµРЅРёРµ Р·РІСѓРєРѕРІС‹С… СѓСЃС‚СЂ. - Input 1 РњРёРєСЂРѕС„РѕРЅ (Realtek High Definiti 2 РџРµСЂРµРЅР°Р·РЅР°С‡РµРЅРёРµ Р·РІСѓРєРѕРІС‹С… СѓСЃС‚СЂ. - Output 3 Р”РёРЅР°РјРёРєРё (Realtek High Definiti 4 Realtek Digital Output (Realtek ------------------------------ Подскажите пожалуйста, что делать с этим "чайнику" 🙂