А возможно ли ? (Решение аудио капчи)
-
Возможно ли с помощью- ЭТОГО -организовать решение аудио-капчи ??
-
@Ivan Без танцев с бубном нет. Это апи поддерживает только ввод с микрофона. Лучше попробовать какой-то движок для десктопа или апи, который принимает файлы.
Чтобы потестить, я скачал несколько аудио файлов с второй рекапчи, скачал pocketsphinx и ffmpeg. Конвертировал mp3 в wav
ffmpeg -i audio.mp3 -acodec pcm_s16le -ac 1 -ar 16000 out.wav
Взял простенькую грамматику
#JSGF V1.0; grammar digits; <digit> = oh | zero | one | two | three | four | five | six | seven | eight | nine ; public <digits> = <digit>+;
И запустил определение с такими параметрами
pocketsphinx_continuous -infile output.wav -hmm model\en-us\en-us -dict model\en-us\cmudict-en-us.dict -jsgf digits.gram > res.txt
В результате, в файле res.txt обычно оказывалась половина правильных цифр, так что потенциал есть.
Ну и БАС можно все это использовать через Запустить Процесс.
-
Что, такое действительно возможно?
-
@Garex22 Через webkitSpeechRecognition затруднительно. Он не работает с файлами. Я пробовал микрофон приставить к колонкам - определились левые слова. Через консольные приложение - вполне возможно. Еще есть google speech api, возможно другие аналоги.