Обработка входного голосового потока
Добавлено: 23 июл 2015, 10:49
Добрый день!
Я пытаюсь создать систему, которая бы распознавала речь в реальном времени. Для этого я использую команду monitor() и YandexSpeechApi.
Я слежу за файловой системой и жду когда Asterisk внесет изменения в файл входного звукового потока. Когда происходят изменения - прочитываем их и отправляем частями в яндекс. И это работает. Проблема такого решения состоит в довольно большом времени распознавания. Пытаясь всячески оптимизировать процесс, было обнаружено, что Asterisk записывает данные в файл раз в 3-4 секунды. Могу ли я каким-либо способом изменить это время? Или могу я напрямую, не записывая в файл, получить звуковой поток? Или, возможно, есть другой подход к задаче?
Спасибо!
Я пытаюсь создать систему, которая бы распознавала речь в реальном времени. Для этого я использую команду monitor() и YandexSpeechApi.
Я слежу за файловой системой и жду когда Asterisk внесет изменения в файл входного звукового потока. Когда происходят изменения - прочитываем их и отправляем частями в яндекс. И это работает. Проблема такого решения состоит в довольно большом времени распознавания. Пытаясь всячески оптимизировать процесс, было обнаружено, что Asterisk записывает данные в файл раз в 3-4 секунды. Могу ли я каким-либо способом изменить это время? Или могу я напрямую, не записывая в файл, получить звуковой поток? Или, возможно, есть другой подход к задаче?
Спасибо!