Страница 1 из 1

Кластер развалился, собрался, что-то пошло не так

Добавлено: 08 дек 2014, 18:12
evas
Данность: FreePBX 2.8.1 (11.7.0), кластер DRBD-Heartbeat (Primary/Secondary), CentOS.
Проблема: Система теряет стабильность после перезагрузки конфигов: любое изменение -> submit -> apply, после этого треть пиров - (Unspecified), при этом теряют регистрацию всегда те же самые. Что интересно, это и экстеншны, прописанные на IP-телефонах и экстеншны аналоговых аппаратов и пара транков. Никак не сгруппированы по структуре локальной сети. По команде CLI> database showkey sip/registry/XXXX эти пиры выдают портянку регистраций (у пиров, которые не отваливаются - всегда одна строка регистрации).
Предположение: Кластер разобрался и неправильно собрался, возможно сбойнула БД. В процессе работы был превышен объем звукозаписей, которые отображает и воспроизводит веб-интерфейс FreePBX (по умолчанию - 3000). Этот параметр был изменен на 10000 и выполнена команда amportal restart, здесь прошу ответа, корректна ли данная команда для кластера? Команда выполнялась в консоли, а не в веб-интерфейсе, поэтому предположение, что в перезагрузку пошел основной сервер, резервный стал основным, а конфиги резервного были неактуальны и применились. Потерлась неделя изменений в конфигах и файлы записей в папке /monitor. Переключением сетевых проводов удалось добиться, чтобы основной сервер стал основным, а резервный - резервным (так ведь и должно быть в DRBD-кластере), но в итоге есть Проблема.

Re: Кластер развалился, собрался, что-то пошло не так

Добавлено: 08 дек 2014, 18:31
awsswa
базы mysql сбойнули ?

Re: Кластер развалился, собрался, что-то пошло не так

Добавлено: 08 дек 2014, 18:49
evas
Наверно да. Многое, но не все объясняется тем, что есть мистический экстеншн 2921, который изначально существовал на транке, потом был перенесен на внутреннюю аналоговую линию, потом он стал настоящим ip-фоном. Теперь он немного мусорит, но... database showkey sip/registry/2921 показывает пять строчек регистрации, а database deltree sip/registry/2921 говорит, что удалять нечего, пусто!

Re: Кластер развалился, собрался, что-то пошло не так

Добавлено: 08 дек 2014, 20:05
awsswa
так снесите этот файл в чистую - ./var/lib/asterisk/sqlite.db
там правда придется по веб морде побегать и восстановить некоторые значения которые хранились в базе - но нечего критично - все решается в течение 1 часа

Re: Кластер развалился, собрался, что-то пошло не так

Добавлено: 10 дек 2014, 18:15
evas
Этот вариант я пока держу в уме, но есть устойчивое мнение, что сеть кривая. Сеть не наша, мы - только сегмент, сейчас занимаемся приведением в порядок. Но уже сейчас могу сказать - большая часть проблем - в сети, разбирайтесь с вашими сисадминами!

Re: Кластер развалился, собрался, что-то пошло не так

Добавлено: 17 фев 2015, 08:00
evas
Итак, проблема решена, спасибо awsswa за подсказку. Действительно, пришлось снести astdb.sqlite3 и побегать ручками по вебморде. Астериск создает файл базы данных автоматически, но значения ampuser, device, qpenalty там отсутствуют. Пришлось пройтись по всем extensions и очередям и пересохранить. Теперь submit -> apply никак не влияет на регистрацию, sip/registry - по одному на пир, размер базы - около 120 килобайт (было около 10 Мб).

Re: Кластер развалился, собрался, что-то пошло не так

Добавлено: 17 фев 2015, 20:41
SolarW
А еще можно было попробовать восстановить эту базу.
В каталоге с базой выполнить

Код: Выделить всё

service asterisk stop
cp astdb.sqlite3 astdb.sqlite3.old
echo ".dump" | sqlite3 astdb.sqlite3 | sqlite3 astdb_new.sqlite3
mv astdb_new.sqlite3 astdb.sqlite3
amportal restart
Не помню точно но скорее всего перед этим еще надо было бы сделать

Код: Выделить всё

yum install sqlite sqlite-devel
Но проверять настройки все равно пришлось бы.
У меня после такого восстановления как-то вырубилась информация о записях разговоров...
Пришлось заново включать вручную в настройках всех ext'ов.

P.S. В моем случае это FreePBX Distro был.