管理エージェントのメトリック
管理エージェントのヘルス、容量およびパフォーマンスは、メトリック、アラームおよび通知を使用してモニターできます。
詳細は、モニタリングの概要および通知の概要を参照してください。
このトピックでは、管理エージェント・サービスによってoci_managementagent
メトリック・ネームスペースに出力されるメトリックについて説明します。
管理エージェント・サービスのメトリックの概要
管理エージェントは、Oracle Cloud Infrastructureサービスが顧客のVMと安全に相互作用できるようにする一方向パイプを提供します。エージェントは、最も単純なネットワーク・トポロジで動作し、VM上での特別な構成は必要ありません。エージェントは、パフォーマンス・メトリックを収集して作業を実行するための拡張可能なモデルをOracle Cloud Infrastructureサービスに提供します。
管理エージェント・リソースのサービス・メトリックを使用すると、ユーザーはエージェントのリソース消費をCPU、メモリーおよびディスクでビジュアル化できます。
前提条件
-
IAMポリシー: リソースをモニターするには、管理者が記述したポリシー内で、必要なタイプのアクセス権がユーザーに付与されている必要があります。ユーザーがコンソールを使用しているか、SDK、CLIまたはその他のツールでREST APIを使用しているかに関係ありません。ポリシーでは、モニタリング・サービスおよびモニター対象リソースへのアクセス権が付与されている必要があります。アクションを実行しようとしたときに、権限がないか認可されていないというメッセージが表示された場合は、付与されているアクセス権のタイプおよび作業するコンパートメントを管理者に確認してください。モニタリングのためのユーザー認可の詳細は、関連するサービス(モニタリングまたは通知)の「認証と認可」セクションを参照してください。管理エージェントのポリシーの詳細は、管理エージェント・サービスのためのOracle Cloud Infrastructureの設定を参照してください。
-
このページに記載されているメトリックは、インストールするすべての管理エージェントで自動的に使用可能になります。これらのメトリックを取得するためにリソースのモニタリングを有効にする必要はありません。
使用可能なメトリック: oci_managementagent
管理エージェント・サービスは、モニタリング・サービスのoci_managementagent
メトリック・ネームスペースにメトリックを出力します。
次の表に記載されているメトリックは、インストールするすべての管理エージェントで自動的に使用可能になります。これらのメトリックを取得するためにモニタリングを有効にする必要はありません。モニタリング・サービスを使用して、カスタム問合せを作成することもできます。
ディメンション
管理エージェントのメトリックには、次のディメンションが含まれます:
-
AGENTHOSTNAME: 管理エージェントがインストールされているホスト名。
-
RESOURCEID: 管理エージェント・リソースのOCID。
メトリック
メトリック名 | メトリック表示名 | 単位 | 頻度 | 説明 | ディメンション |
---|---|---|---|---|---|
agentHealthStatus |
エージェント・ヘルス・ステータス | 該当なし | 1分 |
エージェントが稼働中で、モニタリング・サービスと通信しています。 このステータス値は定数(1)であり、エージェントが稼働しており、モニタリング・サービスにアップロードできることを示します。モニタリング・サービスのデータ・ポイントの欠落は、エージェントがモニタリング・サービスと通信できないことを意味します。エージェントが停止していることは意味しません。 |
|
diskUsageUsed |
エージェント・ディスク使用率 | MB | 1時間 | agent_inst内の使用されたディスクの合計容量。 |
|
diskUsageFree |
エージェントの使用可能なディスク領域 | MB | 1時間 | ボリュームで使用可能なディスク領域の容量。 |
|
diskUsageInstallSize |
インストールのディスク使用量 | MB | 1時間 | agentBaseDir内の使用されたディスクの合計容量。 |
|
uploadBufferPctusedofmaxbuffer |
使用された一時ストレージの割合 | パーセント | 15分 | モニタリング・サービスが使用可能になるまで待機する間に、エージェントがコンテンツを一時的に格納するために使用されたディスク領域の容量。この数はエージェントの上限に対する割合として表されます(デフォルトの制限: 100MB)。 |
|
usageCpu |
エージェントCPU使用率 | パーセント | 1分 | エージェントのCPU使用率。 |
|
usageRss |
エージェント・メモリー使用率 | MB | 1分 | エージェントのJVMによって消費されたメモリーの量。この数値は、メイン・メモリー内の常駐設定サイズを表します。 |
|
マーケットプレイス・アプリケーションを使用したデフォルト・アラームの設定
事前定義されたメトリックしきい値を持つデフォルトのアラームを自動的に設定するには、Oracle Cloud Infrastructure (OCI) Marketplaceから管理エージェントのデフォルト・アラーム・アプリケーションを使用できます。このマーケットプレイス・アプリケーションでは、管理エージェントおよびログ・アナリティクス・メトリックの即時利用可能な複数のアラームを自動的に構成できます。
Marketplaceの使用方法の詳細は、Overview of Marketplaceを参照してください。
-
デフォルトで複数の推奨メトリックの構成および監視を自動化する簡単な方法。
- テナンシ(ルート・コンパートメント)の下のすべての管理エージェントのデフォルト・アラームを1ステップで作成します。
- アラーム定義は、管理エージェントがインストールされる前に事前に作成されます。
- リソース・マネージャおよびスタック(Terraform構成)を使用して、設定と構成を簡略化します(デフォルトのアラーム構成をカスタマイズし、モニタリングを即時に開始できる、Resource Managerによって実行される自動設定)。
管理エージェント・マーケットプレイス・アプリケーションのデフォルト・アラーム
- 管理エージェント・アラーム
- エージェント可用性。
- CPU使用率。
- ディスク領域。
- JVMメモリー使用量。
- ログ・アナリティクス・アラーム
- ロギング分析アップロード・データ・サイズ。
- ロギング分析のアップロードに失敗しました。
- サブスクリプションなしの「通知宛先」トピック(「新規作成」オプションが選択されている場合)。これはOCI通知サービスの一部で、トピックとサブスクリプションを使用してメッセージを公開するための通信チャネルを設定できます。詳細は、通知を参照してください。
- 選択したメトリックのアラーム定義。デフォルトでは、4つの管理エージェント・メトリック・アラーム(可用性、CPU、ディスクおよびメモリー・アラーム)および2つのログ・アナリティクス・メトリック・アラーム(ロギング・アナリティクス・アップロード・データ・サイズおよびロギング・アナリティクス・アップロード失敗アラーム)が作成されます。
アーキテクチャ
管理エージェントは他のOracle Cloud Infrastructureサービスと完全に統合されているため、リソース・マネージャおよびスタックを使用してログ・アナリティクスのメトリック・アラーム構成を簡単に自動化できます。アラームが定義されると、Monitoringサービスを使用して監視され、メトリックがNotificationsサービスを使用してアラーム指定のトリガーを満たしたときに通知されます。
前提条件
- ユーザーには、管理エージェント、メトリックおよび通知トピックを管理するための権限またはポリシーが必要です。
- ユーザーは管理グループの一部であるか、リソース・マネージャ・スタックを起動する権限を持っている必要があります。
ユーザーが管理グループに含まれていない場合は、リソース・マネージャ・スタックを起動するために次の権限が必要です。
# Policies required to manage stacks and jobs in OCI Resource Manager ALLOW GROUP <User-Group> TO MANAGE orm-stacks IN TENANCY ALLOW GROUP <User-Group> TO MANAGE orm-jobs IN TENANCY # Policies required to read and manage IAM resources ALLOW GROUP <User-Group> TO READ compartments IN TENANCY ALLOW GROUP <User-Group> TO READ tenancies IN TENANCY ALLOW GROUP <User-Group> TO MANAGE dynamic-groups IN TENANCY ALLOW GROUP <User-Group> TO MANAGE policies IN TENANCY # Policies required to manage Management Agents ALLOW GROUP <User-Group> TO MANAGE management-agents IN TENANCY ALLOW GROUP <User-Group> TO READ metrics IN TENANCY # Policies required to create and manage alarms and notification topics ALLOW GROUP <User-Group> TO MANAGE alarms IN TENANCY ALLOW GROUP <User-Group> TO USE ons-topics IN TENANCY
ノート
ポリシーを特定のコンパートメントに明示的に制限するには、TENANCY
のかわりに<COMPARTMENT_NAME>
を使用します。例:ALLOW GROUP <User-Group> TO MANAGE ALARMS IN COMPARTMENT <COMPARTMENT_NAME>
.ユーザー・グループの作成および管理の詳細は、グループの管理を参照してください。
マーケットプレイス・アプリケーションを使用した管理エージェントのデフォルト・アラームのデプロイ
-
Oracle Cloudにサインインします。
-
ナビゲーション・メニューを開きます。「マーケットプレイス」で、「マーケットプレイス」をクリックしてすべてのアプリケーションを表示します。
-
検索ボックスに移動し、管理エージェントを入力して、管理エージェントのデフォルト・アラーム・スタック・リストを選択します。
リストの詳細が表示されます。
-
「スタック・バージョン」および「コンパートメント」を選択します。
-
Oracle使用条件をレビューし、「確認して受諾しました」チェック・ボックスを選択します。
-
「スタックの起動」をクリックします。
「リソース・マネージャ」ページが表示され、「スタックの作成」プロセスが表示されます。
-
ステップ1の「スタック情報」で、スタック情報を確認します。
-
「名前」で、自動移入された名前を確認してスタックを識別します。
-
「説明」で、オプションでスタック・デプロイメントの説明を追加します。
-
「コンパートメントに作成」で、ドロップダウン・リストからコンパートメントを選択します。
-
オプションで、ネームスペース・タグを指定してリソースを編成およびトラッキングします。
-
次のステップを続行するには、「次」をクリックします。
-
-
ステップ2の「変数の構成」で、必要に応じてデフォルト設定を確認および更新します。
- 「必要な構成」で、次を確認します:
-
「管理エージェント・コンパートメント」で、管理エージェントがインストールされているコンパートメントを選択します。
- ルート・コンパートメント/テナンシが選択されている場合は、「ネストされた管理エージェント・コンパートメントの有効化」チェック・ボックスが表示されます。サブコンパートメント内のエージェントをモニターしない場合は、このチェック・ボックスの選択を解除します。
- サブスクリプションのない新しい通知宛先トピックを作成するには、「新規トピックの作成」チェック・ボックスを選択します。通知宛先トピックがすでに作成されている場合は、このチェック・ボックスの選択を解除します。
- 「スタック識別子」に、作成するアラームおよび通知トピックを識別する一意の名前を入力します。
- 「前提条件」で、必要なポリシーを確認して確認します。
-
- 「管理エージェント・アラーム構成」で、デフォルトで作成される4つのアラーム定義を確認します。
- アラームの設定を無効化または変更するには、「管理エージェント・アラームのカスタマイズ」を選択します。
ノート
アラームをモニターしない場合は(スタック作成から削除)、アラーム・チェック・ボックスの選択を解除します。 - 管理エージェントの可用性を確認するアラームを設定するには、「可用性アラーム」を選択します。
- 管理エージェントのCPUパーセンテージに対してアラームを設定するには、「CPUアラーム」を選択します。
- 管理エージェントのディスク領域のアラームを設定するには、「ディスク・アラーム」を選択します。
- 管理エージェントによって消費されるメモリー量をチェックするアラームを設定するには、「メモリー・アラーム」を選択します。
ノート
必要に応じて、アラームのアラーム間隔、しきい値および重大度を変更します。
- アラームの設定を無効化または変更するには、「管理エージェント・アラームのカスタマイズ」を選択します。
- 「ログ・アナリティクス・アラーム構成」で、デフォルトで作成される2つのアラーム定義を確認します。
- アラームを設定するには、「ロギング分析メトリックの追加」を選択します。アラームが不要な場合は、このチェックボックスをオフにします。
- 2つのアラームのいずれかの設定を削除または変更するには、「ロギング分析アラームのカスタマイズ」を選択します。
- ログ収集アップロード・データ・サイズのアラームを設定するには、「ログ・アナリティクス・アップロード・データ・サイズ・アラーム」を選択します。
- ログ収集のアップロードが失敗した場合にアラームを設定するには、「ログ・アナリティクス・アップロード失敗アラーム」を選択します。
- 「必要な構成」で、次を確認します:
-
ステップ3の「レビュー」で、すべての情報が正確で完全であることを確認します。
- 「Run apply on the created stack?」で、「Run apply」チェック・ボックスの選択を解除します。
これにより、このプロセスがスタックのみを作成するようになります。適用スタックは別のステップで実行されます。
- 「Run apply on the created stack?」で、「Run apply」チェック・ボックスの選択を解除します。
-
「作成」をクリックします。
ページがスタックが作成されたことを示すまで待ってから、次のステップに進みます。
-
「スタックの詳細」ページで、「プラン」をクリックしてプラン・ジョブを作成します。
プラン・ジョブに一意の名前を指定し、「プラン」をクリックします。
-
同じページの「ログ」セクションをレビューして、問題がないことを確認します。
-
ナビゲーション・メニューから「スタックの詳細」を選択します(「リソース・マネージャ」>「スタック」>「スタックの詳細」)。作成されたスタックで、「ジョブ情報」に移動し、「状態」に
Succeeded
と表示されていることを確認します。 -
「スタックの詳細」タブに移動し、「適用」をクリックします。
-
適用ジョブを識別する一意の名前を指定します。
-
「ジョブ・プランの解決の適用」を選択して、選択したものを自動的に承認します。
-
「適用」をクリックして、適用ジョブを実行します。
このプロセスによってアラーム定義が作成され、通知トピックにバインドされます。
「ログ」セクションをレビューして、問題がないことを確認します。
-
「ジョブ情報」タブで、「状態」に
Succeeded
が表示されていることを確認します。 -
「リソース」左メニューから、「出力」をクリックして実行出力情報を表示します。
-
Githubを使用した管理エージェントのデフォルト・アラームのデプロイ
Githubを使用して「管理エージェントのデフォルト・アラーム」スタックをデプロイすることもできます。
-
https://github.com/oracle-quickstart/oci-observability-and-management/o11y-ingestion-monitoringにアクセスします。
-
「Oracle Cloudにデプロイ」をREADME.mdセクションからクリックします。
-
Oracleの使用条件に同意し、「次」をクリックします。
-
Resource Manegerを使用してスタックを適用します。
「マーケットプレイス・アプリケーションを使用した管理エージェントのデフォルト・アラームのデプロイ」セクションに移動します。手順1から6をスキップし、手順7から始まる手順に従います。
コンソールの使用
-
ナビゲーション・メニューを開きます。「監視および管理」で、「モニタリング」に移動して「サービス・メトリック」をクリックします。
-
「メトリック・ネームスペース」で、「oci_managementagent」を選択します。
-
「ディメンション」にresourceIdを指定し、サービス・メトリックを表示しようとする管理エージェントの
OCID
を選択します。
ページに、管理エージェントによって出力されるメトリックのチャートが表示されます。
APIの使用
APIの使用およびリクエストの署名の詳細は、REST APIおよびセキュリティ資格証明を参照してください。SDKについては、ソフトウェア開発キットとコマンドライン・インタフェースを参照してください。