インフラストラクチャ・ヘルス・メトリック
コンピュート仮想マシン(VM)およびベア・メタル・インスタンスのインフラストラクチャのヘルス、容量およびパフォーマンスは、メトリック、アラームおよび通知を使用してモニターできます。
このトピックでは、メトリック・ネームスペースoci_compute_infrastructure_health
によって出力されるメトリックについて説明します。
リソース: コンピュート・インスタンス。
メトリックの概要: oci_compute_infrastructure_health
コンピュートのインフラストラクチャ・ヘルス・メトリックは、コンピュート・インスタンスのステータスおよびヘルスのモニターに役立ちます。
- インスタンス・ヘルス(アップ/ダウン)ステータス:
instance_status
メトリックにより、VMインスタンスが実行中の状態のときに使用可能(稼働中)か使用不可(停止)かを確認できます。インスタンスが30分を超えて使用できない場合は、サポートに連絡してください。 - インスタンス・メンテナンス・ステータス:
maintenance_status
メトリックにより、VMまたはベア・メタル・インスタンスの計画インフラストラクチャ・メンテナンスがスケジュールされているかどうかをモニターできます。 - ベア・メタル・インフラストラクチャ・ヘルス・ステータス:
health_status
メトリックにより、CPUやメモリーなどのハードウェア・コンポーネントを含むベア・メタル・インスタンスのインフラストラクチャのヘルスをモニターできます。
メトリックの値に基づいて、予防的に影響を受けるインスタンスを正常なハードウェアに移動できるため、アプリケーションへの影響を最小限に抑えることができます。
必要なIAMポリシー
リソースをモニターするには、コンソールまたはREST API (およびSDK、CLIまたはその他のツール)のどちらを使用しているかにかかわらず、管理者が作成するポリシーで必要なアクセスのタイプが付与されている必要があります。ポリシーでは、モニター・サービスおよびモニター対象のリソースにアクセス権を付与する必要があります。アクションを実行しようとして、権限がない、または認可されていないというメッセージが表示された場合は、管理者に連絡して、付与されているアクセスのタイプと作業する必要があるコンパートメントを確認してください。モニタリングのユーザー認可の詳細は、「IAMポリシー」を参照してください。
使用可能なメトリック: oci_compute_infrastructure_health
次の表に示すメトリックは、インスタンスで自動的に使用可能になります。これらのメトリックを取得するためにインスタンスでモニタリングを有効にする必要はありません。
モニタリング・サービスを使用して、カスタム問合せを作成することもできます。
メトリックに応じて、次のディメンションを使用できます:
- faultClass
-
ハードウェアの問題のタイプ:
CPU
: 1つ以上のCPUで障害が検出されました。MEM-BOOT
: インスタンスの起動中または最近の再起動中にメモリー・サブシステムで障害が検出されました。MEM-RUNTIME
: メモリー・サブシステムで障害が検出されました。MGMT-CONTROLLER
: インスタンス管理コントローラの障害が検出されました。PCI
: PCIサブシステムの障害が検出されました。-
PCI-NIC
: インスタンス・ネットワーク・インタフェース・カード(NIC)で障害が検出されました。 SDN-INTERFACE
: インスタンス・ソフトウェア定義ネットワーク・インタフェースで障害が検出されました。
- resourceDisplayName
- インスタンスのわかりやすい名前。
- resourceId
- インスタンスのOCID 。
- maintenanceDueTime
-
24時間メンテナンス・ウィンドウのスケジュールされた開始時間(RFC3339で定義されたフォーマット)。
- computeMaintenanceAction
-
スケジュール済メンテナンス・イベント中にインスタンスでOracle Cloud Infrastructureが実行するアクション:
REBOOT
: インスタンスは、メンテナンスが必要な物理ホストから正常なホストに移行されます。ライブ移行が不可能な場合、インスタンスは再起動移行されます。REBUILD_IN_PLACE
: インスタンスは停止され、同じ物理ハードウェア上に再構築されてから再起動されます。メンテナンス・プロセス中に数時間の停止時間が発生します。
- recommendedAction
-
アプリケーションで停止時間が発生する方法とタイミングを制御できるように、スケジュールされたメンテナンス・イベントの前に実行できるアクション。
REBOOT
: スケジュールされたメンテナンス時間の前に、インスタンスを事前に再起動できます。メンテナンスのためにインスタンスを再起動移行すると、メンテナンスが必要な物理ホストでインスタンスが停止され、正常なホストで再起動されます。
メトリック | メトリック表示名 | 単位 | 説明 | ディメンション |
---|---|---|---|---|
health_status
|
インフラストラクチャ・ヘルス・ステータス | 問題 |
インスタンスのヘルスの問題の数。ゼロ以外の値はヘルスに不具合があることを示します。 このメトリックは、ベア・メタル・インスタンスでのみ使用できます。 |
|
instance_status
|
インスタンス・ステータス | 件数 |
実行中のインスタンスのステータス。0の値は、インスタンスが使用可能(稼働中)であることを示します。1の値は、インフラストラクチャの問題のためにインスタンスが使用不可(停止)であることを示します。インスタンスが停止済の場合、メトリックに値はありません。 このメトリックは、VMインスタンスでのみ使用できます。 |
|
maintenance_status |
メンテナンス・ステータス | 件数 |
インスタンスのメンテナンス・ステータス。0の値は、インスタンスのインフラストラクチャ・メンテナンス・イベントがスケジュールされていないことを示します。1の値は、インスタンスのインフラストラクチャ・メンテナンス・イベントがスケジュールされていることを示します。 このメトリックは、VMおよびベア・メタル・インスタンスの両方で使用できます。 |
|
コンソールの使用
APIの使用
APIの使用およびリクエストの署名の詳細は、REST APIのドキュメントおよびセキュリティ資格証明を参照してください。SDKの詳細は、SDKおよびCLIを参照してください。