orz記録

おうちとかいしゃのシステム技術のことを中心に書いていこうと思っています。

2014/02/03 15:43hobbitという監視ツールを使っています

こんにちは。会社から更新。社会人失格。ま、技術の話題ですから。

 

会社のサーバ、hobbitという監視ツールを使用しています。今はXymonという名前になっています。

設定が比較的簡単で、豊富な情報が取得できるのが良い所です。

 

が、最近そのhobbitでちょっと不可解なアラートが出て困っていました。

プロセスの生死確認のための監視を行っているのですが、その仕組みは

監視対象のサーバ側でpsコマンドを発行した結果に、監視対象のプロセス名を検索してプロセスがあるかないかを確認しています。

 

最近監視対象のサーバのpsコマンドの結果が途中の行でぶった切られてしまって、

ぶった切られたpsコマンド結果からプロセス名を検索していたので、本当は立ち上がっているはずのプロセスが検索に引っかからずにプロセスが死亡している旨のアラートが発砲されることがたびたびありました。

 

色々と探していたら、下記のサイトにたどり着きました。

 

http://lists.xymon.com/oldarchive/2010/01/msg00128.html

http://ymkx.net/cat63/linuxnetwork/hobbit_got_oversize_message.html

 

どうやらhobbitはサーバから報告する、またはその報告を受取るデータのサイズに上限を設定するパラメータがあるようです。

 

hobbitサーバ(受け取り側)は、hobbitserver.cfgで

 

MAXLINE

MAXMSG_STATUS

MAXMSG_NOTES

MAXMSG_DATA

MAXMSG_CLIENT

MAXMSG_CLICHG

 

の値を適切に設定します。

適切な値はhobbitd.logでログを見ながら調節すれば良いと思います。

 

hobbitクライアント(送り側)は、hobbitclient.cfgで

 

MAXLINE

MAXMSG_CLIENT

 

の値を適切に設定します。

適切な値はhobbitclient.logを見ながら調節すれば良いと思います。

 

ログには、Oversize status msg from XX.XX.XX.XX for hostname:procs truncated ( n=1054871, limit 1048576 )

 

とか出てるので、limitが1048576の場合は、おそらく

MAXMSG_CLIENT=1024

となってると思われるので、2048などにしておくと良いとおもいます。

 

ではではー。