Тёмный

Speech recognition / Python Lessons 

Exploring the IT World / Oleg Shpagin / WISEPLAT
Подписаться 148 тыс.
Просмотров 28 тыс.
50% 1

Опубликовано:

 

20 окт 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 69   
@wiseplat
@wiseplat 4 года назад
►► Смотри все уроки по Python: ru-vid.com/group/PLxiU3nwEQ4PHtLT8LzGAdcuzE-laotXps Пишите в каких проектах вы планируете это использовать или уже используете!
@АндрейП-ц5ы
@АндрейП-ц5ы 2 года назад
Здравствуйте! Спасибо за детальное объяснение. Применение помочь другу слепому написать голосового помощника.
@Руссофобзатевающийрусофобию
Скажите пожалуйста почему во всплывающем меню для автозаполнения не всплывает Microphone ? Почему всплывают не все подсказки? Или может вы знаете нормальный плагин для VS Code с нормальными подсказками. Был бы благодарен. А то я понаустанавливал а толку не вижу.
@Руссофобзатевающийрусофобию
Длинное видео. Мелкий текст на белом фоне. Было бы идеально сократить все до 5 минут.
@MrKim-pt2vm
@MrKim-pt2vm Год назад
а как аудиофайл распознать-то?
@MrKim-pt2vm
@MrKim-pt2vm Год назад
а где видео про использование готового аудио файла, без подключения к микрофону, просто mp3 файл в текстовый
@holodnieryki9882
@holodnieryki9882 4 года назад
Веду разработку диплома по похожему принципу(использую ту же библиотеку). Дипломный проект рассчитан на людей (с особым уклоном на программистов) с ограниченными возможностями, а точнее тех у кого проблемы с руками. Разрабатываемая программа позволяет писать программный код голосом (упрощенно, т.е. в неё уже занесены определенные фразы которые заменяются на программный код.(например: "если" - if( ){ } или же "переменная целого типа" - int ). Есть возможность запуска различных внутренних программ системы, поиск в интернете по запросу, управление различными окнами программ (перемещение, копировать/вставить, выделить и тд), запись программного текста и обычного и тд. Желаю удачи с каналом!
@wiseplat
@wiseplat 4 года назад
Привет! Крутой проект создаете! Удачи в проекте!!!
@ernesttrachuk6931
@ernesttrachuk6931 4 года назад
привет , ты используешь recognize_google ? как платную версию ? я так же пишу диплом + практика с такой темой и мне надо Open Sourse API который будет хорошо понимать речь у гугла есть ограничения , а всё хорошее платно как вы решили этот вопрос ?
@holodnieryki9882
@holodnieryki9882 4 года назад
@@ernesttrachuk6931 а если хотите практически без лимита то покопайтесь в сторону "Kaldi"(это инструменты для распознавания речи) Если уж хотите прям прям заморочиться то CMUSphinx в помощь, он и оффлайн и гибок, нооо чутка топорный в плане распознавания)
@ernesttrachuk6931
@ernesttrachuk6931 4 года назад
@@holodnieryki9882 Sphinx не чутка топорной , а конкретно такой топорный , да он конечно работает офлайн , но он даже с английским не справляется я сейчас рассматриваю kaldi , vosk и wav2latter но всё же лучше спросить у того кто уже с этим хорошо знаком , чтобы не делать лишней работы
@holodnieryki9882
@holodnieryki9882 4 года назад
@@ernesttrachuk6931 Ещё есть что-то такое snowboy.kitt.ai/ с ним не работал но всё же
@sokolov1976
@sokolov1976 4 года назад
Спасибо всё заработало до этого пробовал не получалось у вас поглядел и сделал
@sereja732
@sereja732 4 месяца назад
У меня при запуске программы микрофон работает только 1 секунду и выключается 😢
@ЛаураШегирова
@ЛаураШегирова 3 года назад
Супер! Все получилось! Огромное спасибо!!!
@mrmaksimal04ka
@mrmaksimal04ka Год назад
Добрый день, возник вопрос. Когда я выводил какие у меня есть микрофоны у меня вместо русский букв высвечиваеться это:Динамики (High Definition Audio 6 Динамики (Razer Seiren X). Помогите пожалуйста. Что делать?
@gurin.shorts
@gurin.shorts 2 года назад
Олег, привет! У меня не получается пишет какую-то ошибку связанной с PyAudio хоть я его не импортировал. Какой-то бред, но мне обидно(
@14768351
@14768351 4 года назад
Спасибо большое, помогло разобраться
@benandrew7390
@benandrew7390 3 года назад
Спасибо, очень интересно!
@westour4183
@westour4183 4 года назад
Очень хороший урок, жаль что мало лайков(
@__Voidman__
@__Voidman__ 3 года назад
согласен
@voronow3
@voronow3 2 года назад
@@__Voidman__ а я - не согласен: автор предлагает пользоваться проприетарными сервисами коммерческих корпораций, в то время, как есть бесплатные и открытые проекты по распознаванию речи, вроде того же VOSK или CMU Sphinx.
@__Voidman__
@__Voidman__ 2 года назад
@@voronow3 я и не знал, спасибо большое
@римурутемпест-ь8с
@римурутемпест-ь8с 8 месяцев назад
У меня проблема cmd говорит что pip не является внутренней или внешней программой
@Mentalist_1337
@Mentalist_1337 2 года назад
Хочу задать вопрос... имеется такая библиотека в питоне "speech_recognition as sr" и функция собственно скажем r=sr.Recognizer(). Так вот какую нейросеть использует Google в функции r.recognize_google? Если возможно ссылку про нейросеть гугла для распознавания речи)
@runpythonru
@runpythonru 2 года назад
У Олега все уроки хорошие
@НадеждаГорбач-ю2ш
@НадеждаГорбач-ю2ш 2 года назад
Как можно сделать, чтобы оно разпозновало моментально?
@hat4et
@hat4et 3 года назад
интересует именно оффлайновое распознавание...без всяких там сервисов от гугла и яндекса
@vitalimanjur8563
@vitalimanjur8563 3 года назад
хороший вопрос: удивительно все используют сервисов от гугла и яндекса а резервный все молчат как рыбы 🤣🤣🤣🤣🤣🤣🤣🤣🤣🤣
@33Aleksey33
@33Aleksey33 3 года назад
Второй урок есть? Из файла аудио.
@смешныемемы-г1ж
@смешныемемы-г1ж 3 года назад
Здравствуйте! Скачиваю библиотеку, но она не скачивается(у меня пайтон 3.9), как я понимаю нужна версия 3.8?
@Misha-g4k
@Misha-g4k 2 года назад
в меня ошыбка при вводе команды pip install SpeachRecongnition
@kamikazekot
@kamikazekot Год назад
Какая именно?
@НикитаПайков-я7в
@НикитаПайков-я7в 2 года назад
возникла проблема. Все идет хорошо, но когда я что-то говорю выскакивают ошибки. Помогите
@aserr3149
@aserr3149 2 года назад
А что же могло пойти не так?... (Сарказм)
@ernesttrachuk6931
@ernesttrachuk6931 4 года назад
Добрый день, тут вы используете тестовую версию recognize_google я пишу диплом + практика и для всего нужно распознавание речи мне надо Open Sourse API который будет хорошо понимать речь у гугла есть ограничения не могли бы вы посоветовать хороший API для моих задач в приоритете английский , польский и русский языки , но хотя бы английский на хорошем уровне распознания чтобы был но самое главное это чтобы не было ограничений по количеству запросов
@Venux777
@Venux777 3 года назад
Вопрос к автору. На вас последняя надежда. Пишу курсовую работу на эту тему. Работаю с ПайЧарм Инсталирую библиотеку через смd Но с импортированием ее же в ПайЧарм идет проблема: "import speech_recognition as sp ModuleNotFoundError: No module named 'speech_recognition'" Подскажите в чемм может быть проблема. уже все сносил и ставил заново самая новая весрия ПайЧарм стоит Пайтон 3.9.4 пробовал кучу методов, но ничего не работает. ПОМОГИТЕ!!!!!!
@iisuspomozhet
@iisuspomozhet 3 года назад
максимум питон 3.7.х (у меня установлен 3.6), также нужно установить pyaudio (c которой тоже могут быть проблемы),плюс нужно удалить параметры среды, касательно Python (PyCharm не трогай) и создать их заново (1 - путь расположения Python, 2 - путь расположения Scripts. Имена path). Если не разобрался еще, пиши, отвечу
@iisuspomozhet
@iisuspomozhet 3 года назад
r.recognize_google(audio, language='en-US').lower() - эта строка должна запустить скрипт. Проверь со строкой в твоем коде.
@pythontop2158
@pythontop2158 2 года назад
@@iisuspomozhet здраствуйте у меня появилась проблема с pyAudio можете подсказать как её решить
@disabrii
@disabrii Год назад
привет, а у тебя получилось решить проблему? Столкнулась с такой же(
@Venux777
@Venux777 Год назад
@@disabrii так Якщо ти користуєшся саме ПайЧармом, спробуй через F12 (Fn+F12) відкрити консоль, і імпортувати саме в ПайЧарм. Також на Віжуал можна зробити аналогічно. Це лише один із варіантів вирішення, якщо не вийде, напишіть мені знову, я допоможу!
@Dangerous_ACCIDENT786
@Dangerous_ACCIDENT786 3 года назад
А вы сможете мне сделать такую программу или сайт
@aleksandriakovlev8243
@aleksandriakovlev8243 3 года назад
Я стопорнулся на выводе списка микрофонов print(sp.Microphone.list_microphone_names()) ошибка Traceback (most recent call last): File "C:\Users\aluruguay\AppData\Local\Programs\Python\Python39\lib\site-packages\speech_recognition\__init__.py", line 108, in get_pyaudio import pyaudio ModuleNotFoundError: No module named 'pyaudio'
@АндрейКутузов-ф4п
@АндрейКутузов-ф4п 3 года назад
Такая же фигня
@Eonflaks1
@Eonflaks1 3 года назад
pip install pipwin pipwin install pyaudio это выполните и заработает
@pythontop2158
@pythontop2158 2 года назад
@@Eonflaks1 спасибо огромное !!!!помогло!!!!!!
@MrOMEGARUS
@MrOMEGARUS 2 года назад
@@Eonflaks1 Огромное спасибо!!! Сегодня весь день всякой хренью занимался - и пип обновил и по отдельности вручную разные модули и визуал си++ до 14.0 поправил... Но помог только Ваш совет...
@tincersgmd701
@tincersgmd701 3 года назад
подскажите как исправить эту ошибку C:\Users\User>pip install SpeechRecognition Collecting SpeechRecognition Downloading SpeechRecognition-3.8.1-py2.py3-none-any.whl (32.8 MB) |████████████████████████████████| 32.8 MB 43 kB/s Installing collected packages: SpeechRecognition Successfully installed SpeechRecognition-3.8.1 WARNING: You are using pip version 20.2.3; however, version 21.0.1 is available. You should consider upgrading via the 'c:\users\user\appdata\local\programs\python\python39\python.exe -m pip install --upgrade pip' command.
@pythontop2158
@pythontop2158 2 года назад
Это всего-лишь предупреждение на это можно не обращать внимания
@jandosabdiraiym5623
@jandosabdiraiym5623 3 года назад
super
@ОлегЖ-н6й
@ОлегЖ-н6й 3 года назад
Здравствуйте, Олег. А на W-7 будет работать?
@alexanderpadalka5708
@alexanderpadalka5708 3 года назад
@tiollife2866
@tiollife2866 Год назад
У меня вообще не работает
@ВсеиСразу-о5ю
@ВсеиСразу-о5ю 4 года назад
у меня ошибка в начале там пишет не найдено pip
@wiseplat
@wiseplat 4 года назад
Привет! Скорее всего при инсталляции Python вы не установили галочку Add Python 3.8 to PATH. Можно повторно запустить установку Пайтон и выбрать вариант Modify (Модифицировать) - и поставить эту галочку. Попробуйте, если что, напишите. Есть еще пару подходов )))) Windows: Скачайте файл get-pip.py и сохраните у себя на компьютере. Откройте командную строку и перейдите в папку, в которой сохранен get-pip.py В командной строке выполните команду: python get-pip.py или python3 get-pip.py PIP установлен!
@wiseplat
@wiseplat 3 года назад
Привет! ))) Вот смотри как установить pip: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-hqLN2vKpq7Q.html
@0d1ssey
@0d1ssey 2 года назад
Что делать если код запускается, а речь не записывается и ошибок не выдаёт? pyaudio и portaudio успешно установлены. Mac OS big sir
@Какработает-д7ж
@Какработает-д7ж 3 года назад
Почему он во всех своих уроках не моргает?
@proton5897
@proton5897 3 года назад
смотрит тебе в душу
@первый-я4ю
@первый-я4ю 4 года назад
как распознавать речь ни слова а вот куда обращаться да ---- я разочарован(
@wiseplat
@wiseplat 4 года назад
Привет! Это урок про быстрый способ распознавания речи и создание интерактивных приложений, который может покрывать 90% потребностей. Если хочешь узнать более глубоко про нейросети для распознавания аудио/видео, как их строить (сколько уровней и сколько нейронов на каждом уровне), как их обучать (например методом обратного распространения), как их оптимизировать (например генетическими алгоритмами), выявлять образы и т.д., то записывайся к нам на курсы - мы там тоже такое рассматриваем! wiseplat.org/course-python
@первый-я4ю
@первый-я4ю 4 года назад
@@wiseplat спасибо!
@КАССХИ
@КАССХИ 2 года назад
Скучное видео
@ЮрійСкоб
@ЮрійСкоб Месяц назад
Здравствуйте, хотел вывести список микрофонов, но вывод кириллицы получился не совсем: моя строка - нормально, а описание микрофонов - псевдо. ---- код --------------- import speech_recognition as sp import pyaudio list_mic = sp.Microphone.list_microphone_names() print("список доступных микрофонов: ") for i in range(0, len(list_mic)): print(i, list_mic[i]) ----- вывод ------------------------ список доступных микрофонов: 0 Переназначение звуковых устр. - Input 1 Микрофон (Realtek High Definiti 2 Переназначение звуковых устр. - Output 3 Динамики (Realtek High Definiti 4 Realtek Digital Output (Realtek ------------------------------ Подскажите пожалуйста, что делать с этим "чайнику" 🙂
Далее
Speech Recognition in Python
7:32
Просмотров 184 тыс.