Страница 2 из 3

Re: Google's text to speech for asterisk

Добавлено: 05 апр 2012, 07:43
gosha
tma писал(а):Меня больше интересует распознавание.
это не tts называется. Первые две ссылки темы это про tts. У гугля это надо в сторону google-voice-search смотреть. Оно распознает, но не не сильно хорошо.
gosha@gosha-laptop:~tmp$ ./google-voice-search.pl input-access_code.wav16 ru
{"status":0,"id":"e56922d8e513126b6acda0d4233d7de0-1","hypotheses":[{"utterance":"введите код доступа по завершении нажмите решетку","confidence":0.7497835}]}

gosha@gosha-laptop:~tmp$ ./google-voice-search.pl directory-intro0.wav16 ru
{"status":0,"id":"4f0c32c00a0efce203039558c2dab2c0-1","hypotheses":[{"utterance":"дабро пажаловать справочную службу company пожалуйста введите первые 3 буквы а фамилию того кого вы ищите например используйте 7 для букву и двигателя буквы","confidence":0.68460923}]}
было это:

Код: Выделить всё

input-access_code : "Введите код доступа. По завершению нажмите решётку." 
                 
directory-intro0 : "Добро пожаловать в справочную службу компании. Пожалуйста введите первые три буквы фамилии, того кого вы ищите... Например, используйте семь для буквы ''Q' и девять для буквы 'Z'"
скрипты гуглятся, я пользовал это:
http://virtual-pbx.googlecode.com/svn/t ... -search.pl

Re: Google's text to speech for asterisk

Добавлено: 05 апр 2012, 09:34
tma
zzuz писал(а):ну да , ну да.
Ну а Вы бы взялись за такую задачу? Если отбросить Ваши ничем не обоснованные подтверждения в спаме?
Спамом они и так отдельно занимаются, за что их телекомы постоянно блокируют, обзванивают потенциальных клиентов.
Но в спаме всегда проще прокрутить некую фразу, а не анализировать что их послали на 3 буквы.
Я б руки поотрывал им за это. Но в данном случае даже предполагать, что это спам - глупо.
Правда если нечего ответить, то можно и спамом обозвать, какая разница.

Re: Google's text to speech for asterisk

Добавлено: 05 апр 2012, 09:41
tma
switch писал(а): Нужно писать алгоритм, который из этого набора слов получит то, что тебе нужно.
На самом деле там скорее нужен анализатор разговора, а не его анализ. Т.е. нужно отделить сообщение IVR от ответа оператора,
зафиксировать временную точку и записать ответ оператора, определить конец фразу, сказать "до свидания" и повесить трубку.
В статистике должна быть приложения запись ответа, а не текст.
Если бы IVR всегда работал одинаково, то можно было бы отталкиваться от задержки на IVR, но Oktell работает непредсказуемо, а так же дергает кучу разных баз, поэтому возникают различные задержки, которые не дают точно рассчитать начало ответа оператора + операторы халявщики, поэтому могут ответить не сразу, а так же с задержкой. Короче возникает очень много "но".
Во втором случае используется DTMF, там немного проще, но все равно проблема: ну пропищал я DTMF, но дальше-то нужно понять кто мне ответил - оператора или все тот же IVR, который почему-то пошел не так, как ему полагалось?
Поэтому я и сомневаюсь в том, что стоит за такую работу браться. Скорее всего потом вылезет еще немерянно граблей...
Может есть что-то готовое?

Re: Google's text to speech for asterisk

Добавлено: 05 апр 2012, 10:38
Sfinx
Последний раз когда-то я ковырялся с этой гуглевской ботвой - в ней была одна мелкая проблема, которая состояла в том, что длина отрезка речи не могла превышать 15 секунд. Все что дальше в flac'е - гугль тупо игнорил. Как вариант можно искать паузы между словами и бить на несколько файлов. Вообще - это все "для поиграться" - уж очень оно тормозит с нашими интернетами - сам иногда юзаю на планшете и телефоне.

Re: Google's text to speech for asterisk

Добавлено: 05 апр 2012, 11:58
tma
А чем стандартным в asterisk'е можно сейчас анализировать паузы?
Здесь самое главное не распознать что же там такое говорят, а найти сам факт ответа оператора, а не IVR.
Далее если это оператор - проиграть заранее заданную фразу и записать ответ оператора.

Re: Google's text to speech for asterisk

Добавлено: 05 апр 2012, 12:07
Vlad1983
можно попробовать распознать IVR по факту произнесения слов: нажмите, тональный и пр., который в ответе оператора в первые несколько секунд вряд ли когда-то встретятся.

Re: Google's text to speech for asterisk

Добавлено: 05 апр 2012, 13:13
tma
Тоже мысль, но тогда нужно иметь пачку вариантов что в каких случаях может произноситься.
Если поменяли IVR (например некое информационное сообщение вставят), то придется весь алгоритм менять.

Re: Google's text to speech for asterisk

Добавлено: 05 апр 2012, 13:17
Vlad1983
для каждого конкретного "атакуемого" весь алгоритм должен быть заложен в БД.
основная проблема скорей всего сведется именно к корректному распознанию (у многих в IVR музыка в фоне, например).

Re: Google's text to speech for asterisk

Добавлено: 05 апр 2012, 13:35
tma
В данном случае "атакуемый" - один и тот же номер, который нужно периодически тестировать несколько раз в день.
Но поведение IVR может различаться в различных ситуациях. Там сообщается в частности о неисправностях и т.д.
Могут вывесить дополнительно какое-нибудь сообщение, причем забыв известив контролирующую службу, как обычно.
Прозваниваться же номер планируется через GSM-шлюз через разных операторов, чтобы иметь представление, что
вызов проходит успешно через каждого оператора и что хватает емкости через каждого из операторов.

Re: Google's text to speech for asterisk

Добавлено: 05 апр 2012, 13:38
Vlad1983
тогда проще нанять девочку студентку на пару часов работы на дому
пусть мочит