インフラストラクチャ・メンテナンス
Oracle Cloud Infrastructureは、コンピュート・インスタンスの物理インフラストラクチャで定期的なデータ・センター・メンテナンスを実行します。このメンテナンスには、ハードウェアのアップグレードと交換、ホストへの電力供給を停止するメンテナンスの実行などのタスクが含まれます。このトピックでは、インフラストラクチャ・メンテナンス、移行オプション、およびインフラストラクチャ・メンテナンスをモニターするために使用できるステータス・メトリックについて説明します。
コンピュートのインフラストラクチャ・ヘルス・メトリックを使用して、メンテナンス中のインスタンスのステータスをモニターできます。
メンテナンス・アクション
Oracle Cloud Infrastructureでは、ライブ移行、スケジュール済メンテナンス、所定の位置での再構築、手動移行など、コンピュート・インスタンスの様々なメンテナンス・アクションがサポートされています。メンテナンス・アクションは、インスタンスが使用するシェイプなどの特性によって異なります。
ライブ移行(停止時間なし)
ライブ移行は、VMの実行中にVMをある物理サーバーから別の物理サーバーに移動するメカニズムです。ライブ移行中は、コンピュート・サービスがメモリーおよびすべての仮想コンポーネントを新しいターゲットVMインスタンスにコピーするときに、ソースVMインスタンスは引き続き実行されます。コピーが完了すると、システムが新しいVMに切り替わったときに、通常は数十ミリ秒単位で測定されるわずかな一時停止のみが発生します。中断は最小限に抑えられます。
定期保守(短い停止時間)
スケジュールされたメンテナンスでは、インスタンスが新しいホストに移動される日付が設定されます。再起動移行を使用して、インスタンスが停止され、正常なホストに移行されてから再起動されます。移行中に短い停止時間が発生します。メンテナンス期日前にインスタンスを事前に再起動することで、停止時間が発生するタイミングを制御できます。まれに、再起動移行が不可能で、インスタンスが終了します。
リビルド・イン・プレース(長いダウンタイム)
このメンテナンス・アクションでは、インスタンスは移動されません。スケジュールされた時間に、インスタンスは停止され、同じ物理ハードウェア上で再構築されてから再起動されます。メンテナンス・プロセス中に数時間の停止時間が発生します。
インプレースでの再構築は、MACアドレスや汎用識別番号などの物理ハードウェアに関連付けられたインスタンス・プロパティを保持します。また、インプレースでの再構築は、ローカルにアタッチされたNVMeベースのSSDをDense I/Oインスタンスに保持します。
VMでは、停止時間を最小限に抑え、ローカルにアタッチされたNVMeベースのSSDを削除する場合は、スケジュールされたメンテナンス時間より前に、インスタンスを再起動できます。インスタンスは正常なホストに再起動移行され、SSDは完全に削除されます。移行中に短い停止時間が発生します。
手動移行
前述のアクションが使用できないVMインスタンスの場合、インスタンスを手動で移動する必要があります。この方法では、インスタンスを削除(終了)した後で、保存されているブート・ボリュームから新しいインスタンスを起動する必要があります。追加のVNICを持つインスタンス、セカンダリIPアドレスを持つインスタンス、リモートでアタッチされたブロック・ボリュームを持つインスタンス、Trusted Platform Module (TPM)が有効になっているインスタンス、またはロード・バランサのバックエンド・セットに属しているインスタンスでは、追加のステップが必要です。
まれに、同じ物理ホスト上のVMインスタンスをリカバリすることはできません。Oracle Cloud Infrastructureでは、14日以内にインスタンスを削除(終了)するように通知されます。期限までにインスタンスを削除しない場合、Oracle Cloud Infrastructureは期限にインスタンスを無効にして、次の7日以内に削除します。ブート・ボリュームおよびリモートでアタッチされたデータ・ボリュームは保持されます。
計画メンテナンスを伴うインスタンスの識別
インスタンスで再起動移行または再構築がサポートされている場合は、「メンテナンス」タブをクリックします。「メンテナンス詳細」ページには、計画メンテナンスの開始がいつスケジュールされるかが示されます。メンテナンスの開始時間と終了時間は、「開始予定」列に表示されます。手動移行のみをサポートするインスタンスの場合、Oracle Cloud Infrastructureによって通知が送信され、メンテナンス・イベントが「メンテナンス詳細」ページに表示されます。
メンテナンスがスケジュールされているインスタンスを識別するには、次のいずれかを行います:
- ナビゲーション・メニューを開き、「コンピュート」をクリックします。「コンピュート」で、「インスタンス・メンテナンス」をクリックします。
メンテナンスがスケジュールされているインスタンスのリストが表示されます。
- 目的のインスタンスをクリックし、そのインスタンスの「メンテナンス」タブをクリックします。この開始日時と終了日時は、すべてのメンテナンス・イベントに表示されます。
InstanceMaintenanceEvents
操作を使用して、イベントをリストします。コンパートメント・フィールドを指定して、特定のコンパートメントにメンテナンス・イベントがあるすべてのインスタンスをリストします。instanceActionやlifecycleStateなどのオプションを使用して結果をフィルタし、検索を絞り込みます。
- 上部のナビゲーション・バーで、「リソース、サービス、ドキュメントおよびマーケットプレイスの検索」をクリックし、「拡張リソース問合せ」を選択します。
- 「サンプル問合せの選択」をクリックしてから、「次回のメンテナンス再起動がスケジュールされているすべてのインスタンスの問合せ」をクリックします。
次に、問合せ例を示します。
query instancemaintenanceevent resources where (timeWindowStart > 'Now' && lifecycleState = 'SCHEDULED')
- 「検索」をクリックします。
一致するインスタンスのリストが表示されます。
「メンテナンス」タブが空の場合、インスタンスはメンテナンス・イベントによって影響されなくなります。
メンテナンス期限の延長
メンテナンスまたは終了がスケジュールされているインスタンスのメンテナンス期日を延長できます。リブート移行メンテナンスでは、期限の延長がサポートされています。これは通常、標準またはフレックス・シェイプを使用するVMおよびベア・メタル・インスタンスでスケジュールされています。OCIは、期日を延長できる最遅の時間を決定します。
- ナビゲーション・メニューを開き、「コンピュート」をクリックします。「コンピュート」で、「インスタンス」をクリックします。
- 目的のインスタンスをクリックし、「メンテナンス」タブをクリックして、「再スケジュール」をクリックします。
- 「期限の延長」をクリックします。
- 「新しい期限」ボックスで、新しい日時を選択します。
-
「変更の保存」をクリックします
メンテナンス期日が延長されました。メンテナンス期日から24時間以内に、インスタンスは停止され、正常なホストに移行されて、再起動されます。移行中に短い停止時間が発生します。
- GetInstanceMaintenanceReboot操作を使用して、期日を延長できる最遅の時間を確認します。
-
次のいずれかを実行して、メンテナンス期日を延長します:
- VMおよびベア・メタル・インスタンス: InstanceAction操作を使用して、実行するアクションとして値
REBOOTMIGRATE
を渡します。timeScheduled
属性に更新された期日を指定します。 - VM: UpdateInstance操作を使用して、
timeMaintenanceRebootDue
属性の更新された期日を渡します。
メンテナンス期日が延長されました。メンテナンス期日から24時間以内に、インスタンスは停止され、正常なホストに移行されて、再起動されます。移行中に短い停止時間が発生します。
- VMおよびベア・メタル・インスタンス: InstanceAction操作を使用して、実行するアクションとして値
インスタンスのリカバリ
インスタンスの基礎となるインフラが正常でない場合、Oracle Cloud Infrastructureは自動的にインスタンスのリカバリを試みます。メンテナンス・アクションは、インスタンスのタイプによって異なります。
- 仮想マシン(VM)インスタンス: 可能な場合、インスタンスは正常な物理ホストにライブ移行されます。ライブ移行が不可能な場合、インスタンスは、シェイプに応じて再起動移行またはインプレースで再構築されます。
- ベア・メタル・インスタンス: 可能な場合、インスタンスは正常な物理ホストに再起動移行されます。再起動移行が不可能な場合、インスタンスを手動で移行する必要があります。
VMインスタンスの計画メンテナンス
インフラストラクチャ・メンテナンス・イベントがVMインスタンスに影響する場合、Oracle Cloud Infrastructureは、メンテナンスが必要な物理VMホストから新しいVMホストに、実行中のインスタンスの中断を最小限に抑えながら、サポートされているVMインスタンスをライブ移行します。
VMインスタンスをライブ移行できないか、ライブ移行をサポートしていない場合、Oracle Cloud Infrastructureはメンテナンス期日を14日から16日以内にスケジュールし、再起動移行など、必要なメンテナンス・アクションのタイプを説明する通知を送信します。移行中に次のいずれかのイベントが発生した場合、ライブ移行は成功しない可能性があります: インスタンスにアクティビティが多すぎる、APIを使用してインスタンスが変更された、またはインスタンスに関連しない内部エラーが発生した。
VMインスタンスのメンテナンスがスケジュールされている場合、スケジュールされたメンテナンス期日の前に、いつでもインスタンスを事前に再起動して移行できます。事前の再起動による移行により、アプリケーションでダウンタイムが発生する方法とタイミングを制御できます。締切日より前にインスタンスを再起動移行しない場合、シェイプに応じて、インスタンスは再起動移行またはインプレースで再構築されます。
顧客管理のVMインスタンスのメンテナンスは、標準シェイプおよびDense I/Oインスタンス・シェイプ(プラットフォーム・イメージやOracle Cloud Infrastructureの外部からインポートしたカスタム・イメージを含む)でサポートされています。
標準およびDenseIOシェイプの場合、メンテナンス期日を延長できます。
セキュリティ関連のメンテナンス・イベントなど、日付を延長できない場合があります。
移行後、デフォルトでは、インスタンスはメンテナンス・イベントの前と同じライフサイクル状態にリカバリされます。インスタンスをリカバリする代替プロセスがある場合は、オプションで、正常なハードウェアに再起動移行した後もインスタンスが停止したままとなるように構成できます。
ベア・メタル・インスタンスの計画メンテナンス
ベア・メタル・インスタンスにインフラストラクチャ・メンテナンス・イベントが影響する場合、Oracle Cloud Infrastructure は、メンテナンスが必要な物理ホストから正常なホストに、サポートされているベア・メタル・インスタンスを再ブート移行します。Oracle Cloud Infrastructureはメンテナンス期日を14日から16日以内にスケジュールし、再起動移行など、必要なメンテナンス・アクションのタイプを説明する通知を送信します。メンテナンス期日から24時間以内に、ベア・メタル・インスタンスは停止され、正常なホストに移行されて、再起動されます。移行中に短い停止時間が発生します。
ベア・メタル・インスタンスのメンテナンスがスケジュールされている場合、スケジュールされたメンテナンス期日の前に、いつでもインスタンスを事前に再起動できます。事前の再起動により、アプリケーションで停止時間が発生する方法とタイミングを制御できます。期日までにインスタンスを事前に再起動しない場合、インスタンスは再起動移行されます。
ベア・メタル・インスタンスの再起動移行は、Linuxベースのプラットフォーム・イメージを使用する標準インスタンス・シェイプでサポートされています。ベア・メタル・インスタンスの再起動移行は、Windowsまたはカスタム・イメージを使用するインスタンス、保護インスタンス、索引1を持つ物理NICで作成および構成されているセカンダリVNICを持つインスタンス、またはiPXEスクリプトで標準のsanboot
コマンドを使用しないインスタンスではサポートされていません。
標準シェイプの場合、メンテナンス期日を延長できます。
スケジュールされた時間よりも前に再起動しない場合は、Oracle Cloud Infrastructureにより、インスタンスの移行または再構築が行われます。移行後、デフォルトでは、インスタンスはメンテナンス・イベントの前と同じライフサイクル状態にリカバリされます。インスタンスを別のプロセスでリカバリできる場合は、正常なハードウェアに再起動移行した後も、インスタンスを停止したままにするよう構成できるオプションがあります。
インフラストラクチャ障害によるVMリカバリ
ソフトウェアまたはハードウェアの問題が原因でVMインスタンスの基礎となるインフラストラクチャに障害が発生すると、Oracle Cloud Infrastructureは自動的にインスタンスのリカバリを試みます。
標準VMインスタンスは、再起動移行を使用してリカバリされます。これにより、元の物理ホストであるか別の物理ホストであるかに関係なく、正常なホストにVMが自動的にリストアされます。VM障害は、発生から1分以内に検出されます。ホストをすぐにリカバリできない場合は、正常な移動が発生し、VMは別のホストに移動されます。このシナリオでは、正常なホストへの移行と再起動のプロセスが5分以内に自動的に開始されます。再起動時に、プライベートおよびエフェメラル・パブリックIPアドレス、アタッチされたブロック・ボリューム、VNICなどのインスタンス・プロパティは保持されます。
DenseIO VMインスタンスは、同じ物理ホスト上のインスタンスを再起動することでリカバリされます。同じ物理ホスト上でDenseIOインスタンスをリカバリできない場合、Oracle Cloud Infrastructureは14日以内に、インスタンスの再起動移行または削除(終了)を通知します。再起動移行を使用する場合、ローカルのNVMeデータは失われます。期限までにインスタンスを削除しない場合、Oracle Cloud Infrastructureは期限にインスタンスを無効にして、次の7日以内に削除します。ブート・ボリュームおよびリモートでアタッチされたデータ・ボリュームは保持されます。
Oracle Cloud Infrastructureは、実行されたリカバリ・アクションのステータスとともに、VMインフラストラクチャの障害イベントを電子メールまたはお知らせで通知します。インスタンス・ステータス・メトリックをモニターして、予期しない再起動に備えることもできます。
リカバリ後にインスタンスを停止したままにするように構成することで、VMを自動的に再起動しないように選択できます。
インフラストラクチャ・ヘルス・メトリック
メトリック、アラームおよび通知を使用して、コンピュート・インスタンスが実行されるインフラストラクチャのメンテナンス・ステータスをモニターできます。インフラストラクチャ・メンテナンスで考慮するプライマリ・メトリックは、インフラストラクチャ・ヘルス・メトリックです:
- インスタンス・ヘルス(アップ/ダウン)ステータス:
instance_status
メトリックにより、VMインスタンスが実行中の状態のときに使用可能(稼働中)か使用不可(停止)かを確認できます。インスタンスが30分を超えて使用できない場合は、サポートに連絡してください。 - インスタンス・メンテナンス・ステータス:
maintenance_status
メトリックにより、VMまたはベア・メタル・インスタンスの計画インフラストラクチャ・メンテナンスがスケジュールされているかどうかをモニターできます。 - ベア・メタル・インフラストラクチャ・ヘルス・ステータス:
health_status
メトリックにより、CPUやメモリーなどのハードウェア・コンポーネントを含むベア・メタル・インスタンスのインフラストラクチャのヘルスをモニターできます。
コンソールでのインスタンス・ステータスおよびメンテナンス通知の表示
インスタンスのステータスおよびメンテナンス再起動通知は、コンソールの「インスタンスの詳細」ページで確認できます。これらのフィールドを表示するには:
- ナビゲーション・メニューを開き、「コンピュート」をクリックします。「コンピュート」で、「インスタンス」をクリックします。
- 関心のあるインスタンスをクリックします。
- 「インスタンス情報」タブの「インスタンスの詳細」セクションで、「インスタンス・ステータス」フィールドおよび「メンテナンス再起動」フィールドを参照します。ノート
「インスタンス・ステータス」フィールドは、インスタンスが過去1か月に使用できなかった場合にのみ表示されます。