監視サイクル

エージェントの実行は、各サーバー上の cron デーモンによって制御されます。監視サイクルの主なステップは次のとおりです。

  1. エージェントがアイドル状態であることを確認します。

    エージェントの以前の実行が終了していない場合は終了させます。一度に実行できる監視エージェントのインスタンス /opt/SUNWstade/bin/rasagent は 1 つだけです。

  2. 計測レポートの生成と健全性関連イベントの生成に使用する適切なデバイスモジュールをすべて読み込み、実行します。

    計測レポートは、デバイスについて関連するすべての情報をプローブし、/var/opt/SUNWstade/DATA に保持されるレポートにその情報を保存することによって生成されます。システムは、レポートデータと以前のレポートを比較し、相違点を評価して、健全性関連イベントを生成する必要があるかどうかを判断します。

    イベントは、ログファイルで検出された情報をリレーすることによって作成される場合もあります。たとえば、/var/adm/messages.t3 で検出されたすべてのエラーと警告は、詳細な分析なしに「ログイベント」のイベントに変換されます。大部分のイベントは、ソフトウェアにおけるルールまたはポリシーに基づいて問題の存在が確定した時点で生成されますが、ストレージアレイが syslog ファイルで問題を示した場合は、即座にイベントが生成されます。

  3. イベントがスレーブエージェントによって生成された場合は、生成された健全性関連イベントをマスターエージェントに送信し、イベントがマスターエージェントによって生成された場合は、関係する対象すべてにイベントを送信します。

    マスターエージェントはそれ自身のイベントを生成し、スレーブからのイベントも収集します。イベントは、配信される前にマスターで集約されることもあります。

    注 - 集約イベントと保守担当者が対策を講じることを必要とするイベント (対処可能なイベント) は、アラームとも呼ばれます。

  4. 次回の比較のために、計測レポートを保存します。

    イベントログは、ユーザーインタフェースの「管理」タブから開くことができます。Storage Automated Diagnostic Environment ソフトウェアは、必要な統計情報を使用して状態データベースを更新します。一部のイベントでは、イベントが生成される前に特定のしきい値に達することが必要です。たとえば、スイッチポートの CRC カウントが 1 上がっても、一定のしきい値に達しなければイベントは生成されません。

    Storage Automated Diagnostic Environment では、同じデバイスの同じコンポーネントについて複数の電子メールが生成されないようにするため、電子メールのしきい値がサポートされています。指定された時間枠の中ですでに送信されたイベント数を追跡することで、電子メール警告の重複を防ぐことができます。電子メール以外のプロバイダでは、この機能はサポートされていません。

  5. 関連する対象に、イベントまたはアラーム、あるいはその両方を送信します。

    イベントが送信されるのは、通知を設定されている受信者だけです。各受信者に直接関係のあるイベントだけが送信されるように、イベントをタイプによるフィルタで選別できます。

    注 - 電子メールプロバイダと Sun Network Storage Command Center (NSCC。Sun Net Connect プロバイダ経由) は、有効になっている場合にすべてのイベントの通知を受信します。

関連項目