データ・リフレッシュ・パフォーマンスについて

Oracleは、パイプラインでのデータ・ロードのパフォーマンスの向上に常に努めています。

インスタンスのデータのロードのパフォーマンスは異なります。フル・ウェアハウス・ロードと増分データ・ロードの両方のデータ処理が完了するまでの時間は、様々な要因によって異なります。データ・パイプライン・ロードには次のものが含まれます。

  • Oracle Fusion Cloud Applicationsからのデータの抽出。
  • Oracle Autonomous Data Warehouseへのデータのロード。
  • 事前作成済スキーマへのデータの変換。
これらの各ステップを完了する時間は、次のような様々な要因によって決まります。
  • ソース・システムの可用性。
  • ソース・データのサイズと複雑さ。
  • アクティブ化された機能領域。
  • Oracle Autonomous Data Warehouseに影響を与えるカスタムSQL問合せ。
  • 問合せが同時に実行されます。
  • ソース・システム・オブジェクトに対して行われたカスタマイズ(これらのオブジェクトに対して完全なロードが必要)。
  • ソース・システムとターゲット・システムのパッチ適用。
結果のキー・メトリックおよびダッシュボードをすべて更新するデータおよびパイプライン実行の日次リフレッシュの場合、実行時間は、増分リフレッシュされるデータの量など、多くの要因によって決まります。ダウンストリーム・ワークフローのニーズを計画するには、次のアクションを実行してください。
  • 「機能を有効化」ページの「データ・リフレッシュ見積」プレビュー機能を使用して、パイプライン実行見積をオンにします。推定リフレッシュ完了の詳細は、「パイプライン設定」ページに表示されます。
  • 推定リフレッシュ完了時間に基づいて後続の操作をトリガーします。
  • 推定完了時間までにリフレッシュが完了していない場合は、Oracle Supportにご連絡ください。
  • イベント通知をサブスクライブすると、パイプライン実行に問題があるとすぐに電子メール通知を受信できます。「イベント通知の有効化(プレビュー)」を参照してください。

通常、データ・パイプライン・ジョブがオフまたはスタック状態でないかぎり、データ・リフレッシュは毎日完了します。特定のソースおよびウェアハウス構成のデータ・ロード時間を監視して、増分日次リフレッシュおよび完全ウェアハウス・ロードにかかる時間を推定できます。この情報は、日単位のデータ・リフレッシュを開始する最適な時間について計画するのに役立ちます。データ・ロードをオフピーク時間中に実行するようにスケジュールできます。たとえば、週末にウェアハウスの初期フル・ロードを実行し、平日の夜に増分ロードを実行して、ユーザーが影響を受けないようにすることができます。

「見積リフレッシュ完了」フィールドの「パイプライン設定」ページで、日次パイプラインの見積リフレッシュ完了時間をプレビュー機能として表示できます。これにより、アプリケーションでタスクを計画できます。
「パイプライン・パラメータ」ページの見積リフレッシュ完了詳細

増分データ・リフレッシュ・プロセスでは、オブジェクトがベース・データセットおよび導出データセットとしてリフレッシュされます。ベース・データセットは、コア・パイプラインの一部であり、Oracle Fusion Cloud Applicationsから直接ソースされ、コア・コンテンツ(トランザクションやディメンションなど)に必要なオブジェクトです。導出されたデータセットは、追加処理が必要なデータ(たとえば、事前構築済の機械学習ユースケースで使用されるデータセット)に基づいています。増分リフレッシュ・プロセスでは、基本データセットが最初にリフレッシュされ、重要なデータが迅速に使用可能になります。システムは、増分ロード完了時間を予測および表示します。ただし、導出されたデータセットについては同じではありません。導出されたデータセットを含むコンテンツをアクティブ化していない場合は、「データ・パイプライン」セクションの「パイプライン設定」ページにこの情報が表示されません。