asr_research

Задача 1

Написать программу, которая распознает голосовые фразы.

Задача 2

Используя платформу Huggingface, провести анализ моделей или использовать готовую библиотеку Python для разделения аудиодорожки на отдельные персоны и распознать текст, сказанный каждой персоной на аудио.

Инструменты

speech_recognition
gTTS
vosk
SbertPuncCase
nltk
pyannote
AudioSegment
whisper
numpy
gc

Инфо

Python 3.11.5
Платформа Mac OS

Для работы кода необходимо создать токен для доступа по инструкции: https://huggingface.co/pyannote/speaker-diarization-3.1

Токен нужен в следующей части кода:

pipeline = Pipeline.from_pretrained( "pyannote/speaker-diarization-3.1", use_auth_token="HUGGINGFACE_ACCESS_TOKEN_GOES_HERE")

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
asr_research.ipynb		asr_research.ipynb
interview_eng.mp3		interview_eng.mp3
razgovor_telephone.mp3		razgovor_telephone.mp3
razgovor_telephone.wav		razgovor_telephone.wav
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

asr_research

Задача 1

Задача 2

Инструменты

Инфо

About

Releases

Packages

Languages

License

ALeksandrUrvanov/asr_research

Folders and files

Latest commit

History

Repository files navigation

asr_research

Задача 1

Задача 2

Инструменты

Инфо

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages