Whisper es un sistema de reconocimiento de voz automático entrenado con 680,000 horas de audio en varios idiomas y acentos, que puede detectar el idioma hablado y convertir el audio en texto o traducirlo al inglés.
Links:
🦻 Whisper GitHub: github.com/openai/whisper
🟠 Google Colab: colab.research.google.com/
Códigos Esenciales:
▶ Instalar Whisper:
!pip install -U openai-whisper
!pip install git+github.com/openai/whisper.git
▶ Transcribir Audio:
!whisper audio.flac audio.mp3 audio.wav --model medium
▶ Traducir Audio:
whisper japanese.wav --language Japanese --task translate
========================================
Índice del video:
00:00 Introducción
00:45 ¿Qué es Whisper?
02:00 Usar Whisper en Google Colab
03:02 Instalar Whisper en Google Colab
06:51 Transcribir audio a texto con Whisper en Google Colab
14:20 Traducir audio con Whisper en Google Colab
17:14 Crear Subtítulos para videos de RU-vid con Whisper
20:48 Conclusiones
========================================
29 июн 2024