asterisk.ru

Добрый день!
Я пытаюсь создать систему, которая бы распознавала речь в реальном времени. Для этого я использую команду monitor() и YandexSpeechApi.
Я слежу за файловой системой и жду когда Asterisk внесет изменения в файл входного звукового потока. Когда происходят изменения - прочитываем их и отправляем частями в яндекс. И это работает. Проблема такого решения состоит в довольно большом времени распознавания. Пытаясь всячески оптимизировать процесс, было обнаружено, что Asterisk записывает данные в файл раз в 3-4 секунды. Могу ли я каким-либо способом изменить это время? Или могу я напрямую, не записывая в файл, получить звуковой поток? Или, возможно, есть другой подход к задаче?
Спасибо!

Есть.
Monitor не нужен, нужно анализировать RTP поток установленного соединения, даже пусть и через tcpdump.

EAGI

?

ded, при таком подходе не понятно как соотносить канал с прослушиваемым портом? Ведь порты для передачи выделаются случайно из какого-то диапазона. Если у меня есть несколько каналов одновременно, как определить что поток проходящий через порт X соответствует каналу Y?

При таком подходе не понятно как соотносить канал с прослушиваемым портом? Ведь порты для передачи выделаются случайно из какого-то диапазона. Если у меня есть несколько каналов одновременно, как определить что поток проходящий через порт X соответствует каналу Y?

Это в SDP написано, кто на каких портах RTP принимает.

обратите внимание на совет с eagi. Сам им непользовался но судя по документации и с учётом предположения, что вам нужен сервис выполняющий голосовые команды(т.к. обычно там требования к скорости), eagi то что вам нужно.

Можно просто написать астерисковое приложение, отправляющее в яндекс данные. Подцепить его через канал LOCAL можно либо конфой, либо через Spy..

asterisk.ru

Обработка входного голосового потока

Обработка входного голосового потока

Re: Обработка входного голосового потока

Re: Обработка входного голосового потока

Re: Обработка входного голосового потока

Re: Обработка входного голосового потока

Re: Обработка входного голосового потока

Re: Обработка входного голосового потока

Re: Обработка входного голосового потока