データ・フローを開始する前に

データ・フローの使用を開始する前に、次が必要です:

  • Oracle Cloud Infrastructureアカウント。トライアル・アカウントは、データ・フローのデモに使用できます。
  • Oracle Cloudサービスのサービス管理者ロール。サービスがアクティブ化されると、Oracleから選択したアカウント管理者に資格証明およびURLが送信されます。アカウント管理者は、サービスへのアクセスを必要とする各ユーザーのアカウントを作成します。
  • 次のようなサポート対象ブラウザがあります:
    • Microsoft Internet Explorer 11.x以上

    • Mozilla Firefox ESR 38以上

    • Google Chrome 42以上

  • Sparkアプリケーションオブジェクト・ストレージにアップロードします。.zip.gzipなどのzipフォーマットでパッケージ化しないでください。
  • 処理のデータをOracle Cloud Infrastructureオブジェクト・ストレージにロードします。データは外部データ・ソースまたはクラウドから読み取ることができます。データ・フローは、Oracle Cloud Infrastructureオブジェクト・ストアに格納されているデータのパフォーマンスとセキュリティを最適化します。
  • サポートされるアプリケーション・タイプは、次のとおりです:
    • Java
    • Scala
    • SparkSQL
    • PySpark (Python 3のみ)
  • この表には、データ・フローでサポートされているSparkバージョンを記載しています。
    サポートされているSparkのバージョン
    Sparkバージョン Hadoop Java Python Scala oci-hdfs oci-java-sdk Sparkのドキュメント
    Spark 3.5.0 3.3.4 17.0.10 3.11.5 2.12.18 3.3.4.1.4.2 3.34.1 Sparkリリース3.5.0のガイド
    Spark 3.2.1 3.3.1 11.0.14 3.8.13 2.12.15 3.3.1.0.3.2 2.45.0 Sparkリリース3.2.1のガイド
    Spark 3.0.2 3.2.0 1.8.0_321 3.6.8 2.12.10 3.2.1.3 1.25.2 Sparkリリース3.0.2のガイド
    Spark 2.4.4 2.9.2 1.8.0_162 3.6.8 2.11.12 2.9.2.6 1.25.0 Sparkリリース2.4.4のガイド
    この表は参照専用であり、包括的ではありません。
ノート

Oracle Cloud Infrastructureコンソール、APIまたはCLIを使用してクラウド・リソースに説明、タグまたはわかりやすい名前を割り当てる場合、機密情報を入力しないでください。これは、データ・フローでアプリケーションを作成または編集する場合に適用されます。