データ・リフレッシュ・パフォーマンスについて

Oracleは、パイプラインでのデータ・ロードのパフォーマンスの向上に常に努めています。

インスタンスのデータのロードのパフォーマンスは異なります。フル・ウェアハウス・ロードと増分データ・ロードの両方のデータ処理が完了するまでの時間は、様々な要因によって異なります。データ・パイプライン・ロードには次のものが含まれます。

  • Oracle Fusion Cloud Applicationsからのデータの抽出。
  • Oracle Autonomous Data Warehouseへのデータのロード。
  • 事前作成済スキーマへのデータの変換。
これらの各ステップを完了する時間は、次のような様々な要因によって決まります。
  • ソース・システムの可用性。
  • ソース・データのサイズと複雑さ。
  • アクティブ化された機能領域。
  • Oracle Autonomous Data Warehouseに影響を与えるカスタムSQL問合せ。
  • 問合せが同時に実行されます。
  • ソース・システム・オブジェクトに対して行われたカスタマイズ(これらのオブジェクトに対して完全なロードが必要)。
  • ソース・システムとターゲット・システムのパッチ適用。
結果のキー・メトリックおよびダッシュボードをすべて更新するデータおよびパイプライン実行の日次リフレッシュの場合、実行時間は、増分リフレッシュされるデータの量など、多くの要因によって決まります。ダウンストリーム・ワークフローのニーズを計画するには、次のアクションを実行してください。
  • 「機能を有効化」ページの「データ・リフレッシュ見積」プレビュー機能を使用して、パイプライン実行見積をオンにします。推定リフレッシュ完了の詳細は、「パイプライン設定」ページに表示されます。
  • 推定リフレッシュ完了時間に基づいて後続の操作をトリガーします。
  • 推定完了時間までにリフレッシュが完了していない場合は、Oracle Supportにご連絡ください。
  • イベント通知をサブスクライブすると、パイプライン実行に問題があるとすぐに電子メール通知を受信できます。イベント通知の有効化(プレビュー)を参照してください。

通常、データ・パイプライン・ジョブがオフまたはスタック状態でないかぎり、データ・リフレッシュは毎日完了します。特定のソースおよびウェアハウス構成のデータ・ロード時間を監視して、増分日次リフレッシュおよび完全ウェアハウス・ロードにかかる時間を推定できます。この情報は、日単位のデータ・リフレッシュを開始する最適な時間について計画するのに役立ちます。データ・ロードをオフピーク時間中に実行するようにスケジュールできます。たとえば、週末にウェアハウスの初期フル・ロードを実行し、平日の夜に増分ロードを実行して、ユーザーが影響を受けないようにすることができます。

日次パイプラインの見積リフレッシュ完了時間は、プレビュー機能として「パイプライン設定」ページの「見積リフレッシュ完了」フィールドに表示されます。これにより、アプリケーションでタスクを計画できます。
パイプライン・パラメータ・ページの見積リフレッシュ完了詳細

増分データ・リフレッシュ・プロセスでは、複数のステージでオブジェクトがリフレッシュされ、重要なデータが迅速に使用可能になります。複数ステージ・リフレッシュ・プロセスには次のものが含まれます。
  • 運用ユースケース用に構成した特定の表の優先度リフレッシュ。
  • 次に、事前作成済モジュールおよびカスタム・データ構成がリフレッシュされます(該当する場合)。このステージでリフレッシュされるオブジェクトは、コア・パイプラインの一部であり、Oracle Fusion Cloud Applicationsから直接ソーシングされ、コア・コンテンツ(トランザクションやディメンションなど)に必要です。
  • 最後に、データセット・タイプのデータ拡張、バージョニング済データセットとして構成されたデータ拡張、最終変更日または最終更新日のないデータ拡張、およびサプライヤ期限内支払予測などの予測モジュールがリフレッシュされます。この段階でリフレッシュされるオブジェクトには、追加の処理(事前作成済の機械学習ユースケースで使用されるデータセットなど)が必要です。

増分ロード完了時間が予測され、表示されます。マルチステージ・リフレッシュ・プロセスで最後に処理されたコンテンツをアクティブ化していない場合は、「データ・パイプライン」セクションの「パイプライン設定」ページにこの情報が表示されません。