Откуда взялась большая величина Load average ?
Как объяснить load average 1 и более при потреблении ресурсов машины менее половины?
Сообщений: 445
|
Откуда взялась большая величина Load average ?
Добрый день!
Использую FreePBX в боксе Elastix.
У меня сервер - два ксеона одноядерных 3ГГц, 2 гиг оперативы, два потока Е1 (задействованы 2 из 4-х карты 407), траффик восновном из Е1 в Е1, есть и воип с транскодингом.
Смотрю загрузку машины, загрузка проца редко бывает больше 15%, память примерно также, больше всех ресурсов потребляет asterisk, если смотреть top. А вот load average частенько бывает 1, и больше, а так - в среднем 0,5 - 0,9. Так вот замечено лично, что с музыкой удержания и голосом воип происходят траблы когда load average больше 1.
Я в инэте обчитал что такое этот load average только вот не понимаю откуда он берется у меня такой большой параметр, когда остальные ресурсы машины практически на минимуме.
|
Сообщений: 445
|
Re: Откуда взялась большая величина Load average ?
top - 15:09:24 up 3 days, 21:07, 2 users, load average: 2.63, 2.39, 2.11
Tasks: 121 total, 1 running, 120 sleeping, 0 stopped, 0 zombie
Cpu(s): 9.2%us, 2.5%sy, 0.0%ni, 88.1%id, 0.0%wa, 0.2%hi, 0.0%si, 0.0%st
Mem: 2074620k total, 2022380k used, 52240k free, 4612k buffers
Swap: 779144k total, 620k used, 778524k free, 1741268k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
3104 asterisk 15 0 45324 23m 7176 S 18 1.1 30:50.94 asterisk
3532 root 15 0 2180 1020 788 R 1 0.0 0:00.05 top
30583 root 15 0 8228 2452 1980 S 1 0.1 0:12.17 sshd
30617 root 15 0 3048 1232 956 S 0 0.1 0:06.13 asterisk
1 root 15 0 2048 628 536 S 0 0.0 0:00.74 init
2 root RT 0 0 0 0 S 0 0.0 0:00.00 migration/0
3 root 34 19 0 0 0 S 0 0.0 0:00.00 ksoftirqd/0
4 root RT 0 0 0 0 S 0 0.0 0:00.00 watchdog/0
5 root RT 0 0 0 0 S 0 0.0 0:00.00 migration/1
вот топ.
Куда копать?
Кстати, по поводу нагрузки телефонной - порядка 4000 минут в день, примерно с 8:00 до 18:00 - то есть не круглосуточно.
|
Сообщений: 445
|
Re: Откуда взялась большая величина Load average ?
Ну вобщем ситуация такая:
Если веб морду не юзать, то load average скачет от 0,2 до 0,8 , иногда перешагивает за 1, но вскоре возвращается.
top - 15:28:06 up 9 min, 2 users, load average: 0.24, 0.20, 0.10
Tasks: 114 total, 1 running, 113 sleeping, 0 stopped, 0 zombie
Cpu(s): 2.0%us, 0.8%sy, 0.0%ni, 97.2%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 2074620k total, 218688k used, 1855932k free, 11784k buffers
Swap: 779144k total, 0k used, 779144k free, 127748k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
3314 asterisk 15 0 12360 8600 1824 S 2 0.4 0:10.26 op_server.pl
3100 asterisk 15 0 32880 12m 6492 S 1 0.6 0:16.37 asterisk
3467 root 15 0 2176 1016 788 R 1 0.0 0:01.07 top
376 root 10 -5 0 0 0 S 0 0.0 0:00.09 kjournald
1 root 15 0 2048 624 536 S 0 0.0 0:00.65 init
2 root RT 0 0 0 0 S 0 0.0 0:00.00 migration/0
3 root 39 19 0 0 0 S 0 0.0 0:00.00 ksoftirqd/0
4 root RT 0 0 0 0 S 0 0.0 0:00.00 watchdog/0
5 root RT 0 0 0 0 S 0 0.0 0:00.00 migration/1
6 root 34 19 0 0 0 S 0 0.0 0:00.00 ksoftirqd/1
7 root RT 0 0 0 0 S 0 0.0 0:00.00 watchdog/1
Вот.
Если юзать морду, тобишь конфигурить, то все вроде тоже нормально.
Описанная в предыдущем посте таблица загрузки возникает когда я начинаю перемещаться с заеладки "reports" в закладку "admin", то бишь мне не удается это сделать: ахтунг не выпадает, просто браузер бесконечно долго загружает страницу.
Морда FreePBX не отвечает.
Морда конфигуратора Elastix отвечает, работает, конфигурит, изменеия якобы применяет.
При этом в консоли аст не реагирует на команды Exit и restart now, но кажет пиров.
Также пропадает входящая связь по потоку на город. На АТС и с АТС работает.
Я не развожу панику, не кричу "ахтунг, помогите спасите за меня мою жизнь...",
Помогите мне найти что так сильно забивает очередь процессов, если ни один процесс не потребляет много ресурсов. Ну или как-то надо решать проблему.
|
Сообщений: 6521
|
Re: Откуда взялась большая величина Load average ?
3314 asterisk 15 0 12360 8600 1824 S 2 0.4 0:10.26 op_server.pl - это FOP, если некритично, не смотри туда, в смысле - не юзай FOP!
Попытайся обращаться напрямую к FreePBX минуя Elastix:
http://your_IIP-address/admin
должно моментально отрабатывать.
|
Сообщений: 445
|
Re: Откуда взялась большая величина Load average ?
ded:
3314 asterisk 15 0 12360 8600 1824 S 2 0.4 0:10.26 op_server.pl - это FOP, если некритично, не смотри туда, в смысле - не юзай FOP!
Попытайся обращаться напрямую к FreePBX минуя Elastix:
http://your_IIP-address/admin
должно моментально отрабатывать.
FOP я пробовал убивать в 3-х PID. После этого он у меня сам не поднимался, правда не помогло трабла все равно присутствовала. Может надо его сконфигурить в unuse как-нибудь?
После того, как поставил Custom context module, в конфигурялке эластикса он не появился, с тех пор конфигурялку эластикса не пользую.
|
Откуда: pl Earth
Сообщений: 224
|
Re: Откуда взялась большая величина Load average ?
нужно найти где он запускается и там убить совсем.
Успехов!
|
Откуда: pl Earth
Сообщений: 224
|
Re: Откуда взялась большая величина Load average ?
имхо - FOP не для продакшина и уж тем более не для машин с таким трафиком. убитьего однозначно стоит.
Успехов!
|
Сообщений: 445
|
Re: Откуда взялась большая величина Load average ?
Ну то есть если я убил FOP командой kill, то там никаких скрытых граблей не должно быть? Какой - нить процесс, ищущий и не находящий FOP там не зациклится?
|
Сообщений: 6521
|
Re: Откуда взялась большая величина Load average ?
Ivon, не надо убивать FOP командой kill.
У него есть скрипт перловый op_panel.pl start | stop
|
Откуда: Уфа
Сообщений: 5856
|
Re: Откуда взялась большая величина Load average ?
для примера: TB 2.0, 220 SIP абонентов, 2 потока, 6000..8000 звонков, 5000..7000 минут в день. Даже при запущеном FOP никаких проблем с качеством не наблюдалось, даже когда одновременных звонков было 40..50 с транскодингом, на процессоре p4 2.6, 845 чипсет, 512 RAM. правда загрузка процессора была около 80..90%, все ресурсы жрал op_panel.pl. на стороне клиента флешпанель тоже тормозит, слишком много кнопок (более 260). В итоге панель сделали на AJAX.
op_panel.pl запускается сам если юзер открывает FOP. чтоб этого не было, я просто этот скрипт удаляю (или перемещаю) куданить и все. один хрен при таком количестве абонентов юзать FOP нереально...
|
|